OpenAI presentó Jalapeño, su primer chip propio para ejecutar modelos de IA, en un proyecto desarrollado junto a Broadcom.

La empresa lo describe como un procesador pensado para inferencia, es decir, para la etapa en la que herramientas como ChatGPT, Codex o una API responden a cada consulta de los usuarios. En la práctica, el costo de servir a millones de consultas diarias.

Según OpenAI y Broadcom, Jalapeño fue diseñado específicamente para modelos de lenguaje y forma parte de una plataforma de hardware de varias generaciones.

Las compañías sostienen que las primeras pruebas muestran mejor rendimiento por watt que las opciones más avanzadas disponibles hoy, aunque todavía no publican benchmarks independientes ni un informe técnico completo.

Cómo es Jalapeño y qué busca resolver OpenAI con este chip

OpenAI explica que Jalapeño cuanta con un diseño hecho desde cero alrededor de las necesidades de inferencia de modelos de lenguaje actuales y futuros.

La idea detrás de un chip personalizado es simple: si una empresa sabe exactamente qué tipo de carga ejecuta todos los días, puede ajustar mejor memoria, redes, movimiento de datos y cálculo para gastar menos energía y responder más rápido.

Broadcom añadió que el proyecto pasó del diseño a la producción en nueve meses, un plazo que ambas compañías presentan como inusualmente rápido para un chip avanzado. OpenAI también afirma que usó sus propios modelos para acelerar partes del diseño y de la optimización.

En el anuncio se menciona además a Celestica como socio para industrializar la plataforma con trabajo en placas, racks, integración de sistemas y producción a escala.

Chip Jalapeño de OpenAI y Broadcom para ejecutar modelos de IA
Jalapeño es la nueva apuesta de OpenAI y Broadcom para ejecutar modelos de IA con más eficiencia.

En sencillo, la “inferencia” es lo que ocurre cada vez que una persona escribe una pregunta en ChatGPT o pide a Codex que revise código: el modelo ya existe y el sistema debe generar una respuesta útil con la menor espera posible.

Por eso OpenAI no presenta Jalapeño como un reemplazo total de todas las GPU que usa la industria ni como un sustituto directo de toda su infraestructura externa. El foco está en ejecutar respuestas con más eficiencia, no en cubrir por sí solo todo el ciclo de desarrollo de la IA.

OpenAI también dijo que muestras de ingeniería del chip ya están corriendo cargas de aprendizaje automático en laboratorio a la frecuencia y potencia objetivo de producción.

Entre esos usos menciona GPT-5.3-Codex-Spark. Esa referencia ayuda a entender el ángulo del anuncio: la compañía quiere controlar más capas de su pila técnica, desde los productos y modelos hasta el hardware que los sostiene.

El efecto más directo de Jalapeño no es un incremento de ingresos para OpenAI, pero si un movimiento que podría reducir parte del costo y de la fricción de operar sus servicios a gran escala.

Cuando una empresa depende menos de aceleradores generales y adapta el hardware a sus propias cargas, gana margen para mejorar velocidad, disponibilidad y costo por respuesta. Eso puede terminar reflejándose en productos más estables o en precios más sostenibles para clientes empresariales y desarrolladores.

También hay un cambio industrial más amplio. OpenAI lleva tiempo expandiéndose desde los modelos y aplicaciones hacia la infraestructura física que los hace funcionar. En lugar de limitarse a alquilar capacidad, ahora busca participar en el diseño del componente central que procesa consultas.

Esa estrategia se parece a la de otras grandes tecnológicas que han desarrollado chips propios para reducir dependencia de proveedores externos y ajustar mejor sus centros de datos.

Por ahora conviene separar lo confirmado de lo que sigue pendiente. Está confirmado que OpenAI y Broadcom lanzaron Jalapeño, que lo orientan a inferencia, que lo presentan como el primer paso de una plataforma de varias generaciones y que hablan de mejor rendimiento por watt en pruebas tempranas.

Lo que todavía falta son métricas auditables y comparaciones públicas que permitan medir cuánto cambia realmente frente a los aceleradores ya dominantes.

Fuentes

OpenAI: OpenAI and Broadcom unveil LLM-optimized inference chip

Broadcom: OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor

TechCrunch: OpenAI unveils its first custom chip, built by Broadcom

Recommended Posts
0
Servidores y módulos de memoria en un centro de datos vinculados al acuerdo entre Micron y Anthropic