IA y computación
OpenAI lanza su primer chip de inferencia de desarrollo propio, Jalapeño: cambio de paradigma y reestructuración competitiva en la cadena de la industria de computación de IA
Análisis profundo del impacto de largo alcance del primer chip de inferencia de IA desarrollado internamente por OpenAI y Broadcom, llamado Jalapeño, en la cadena de suministro de semiconductores, la ruta tecnológica, el panorama competitivo del mercado y la cadena de suministro regional.
Resumen del Evento
El 24 de junio de 2026, OpenAI y Broadcom lanzaron conjuntamente su primer chip de inferencia de IA de desarrollo propio: Jalapeño. Este chip es un circuito integrado de aplicación específica (ASIC) optimizado para la inferencia de modelos de lenguaje de gran escala, con OpenAI encargándose del diseño de la arquitectura subyacente, Broadcom asumiendo la implementación del silicio y el hardware de red, y la empresa canadiense de servicios de fabricación electrónica Celestica encargándose de la integración de las tarjetas y los sistemas en rack. OpenAI afirma que la eficiencia energética (rendimiento/consumo) de Jalapeño superará el estado del arte actual, y las muestras de ingeniería ya están ejecutando modelos como GPT-5.3, Codex y Spark en el laboratorio a la frecuencia objetivo y el consumo de producción.
Este evento no es un caso aislado. Ese mismo día, el CEO de NVIDIA, Jensen Huang, enfatizó en la junta general anual que la "era de la IA práctica" ha llegado y reveló que la plataforma Vera Rubin ya está en plena producción. Google muestra una significativa ventaja de beneficios en el control de costos computacionales y la optimización colaborativa de software y hardware a través de su serie de TPU de desarrollo propio, mientras que Anthropic está profundamente vinculada a la infraestructura computacional de Amazon y Google. La "carrera armamentista" en el campo de la computación de IA está pasando de la escala de los modelos al control autónomo de la infraestructura computacional.
Antecedentes: El Camino Inevitable del Alquiler de Computación al Desarrollo Propio de Chips
En sus inicios, OpenAI dependía completamente de las GPU de NVIDIA en los clústeres de Microsoft Azure para el entrenamiento y la inferencia, manteniendo su liderazgo mediante la "conversión de capital en capacidad computacional". Sin embargo, con el crecimiento exponencial del número de parámetros de los modelos de la serie GPT (se espera que GPT-5.3 supere el cuatrillón de parámetros), los costos de inferencia se han disparado. Según estimaciones de la industria, el costo de electricidad de una sola inferencia de un modelo de nivel GPT-4 ya representa más del 30% de los gastos operativos. Al mismo tiempo, el suministro de GPU de NVIDIA se mantiene ajustado, y la asignación de capacidad de la arquitectura Blackwell prioriza a los grandes proveedores de nube, dejando a las pequeñas y medianas empresas de IA en una situación de "espera de suministro".
En este contexto, el desarrollo propio de chips de inferencia por parte de OpenAI se convierte en una extensión natural de su estrategia de infraestructura integral a largo plazo. El posicionamiento de Jalapeño no es reemplazar por completo a las GPU de NVIDIA, sino centrarse en el escenario de inferencia, que es el eslabón de mayor costo y frecuencia en el despliegue de IA. Mediante ASIC personalizados, OpenAI espera mejorar la eficiencia de inferencia entre 3 y 5 veces (basado en experiencias de diseño similares), reduciendo así significativamente los costos marginales.
Análisis en Profundidad
Impacto TecnológicoJalapeño es un ASIC dedicado a la inferencia, cuya ruta técnica difiere esencialmente de las GPU: - Arquitectura: Emplea una arquitectura de flujo de datos en lugar de SIMT, endureciendo las multiplicaciones matriciales y los mecanismos de atención típicos de los modelos Transformer. Esto evita la sobrecarga de las unidades de cómputo de propósito general en las GPU, pero sacrifica la flexibilidad. - Proceso de fabricación: No se ha revelado el nodo específico, pero según la práctica de la industria, Broadcom suele utilizar el proceso de 5 nm o 3 nm de TSMC. Si se opta por 3 nm, competirá por capacidad con clientes como Apple y NVIDIA. - Interconexión: La comunicación entre chips depende de los conmutadores Tomahawk de Broadcom y de la tecnología personalizada de fotónica de silicio, lo que admite despliegues en clústeres a gran escala. Esto compite directamente con NVLink de NVIDIA.
La barrera técnica radica en que el compilador y el tiempo de ejecución del ASIC de inferencia deben estar profundamente integrados con la pila de software de OpenAI (como Triton y PyTorch). OpenAI ya ha abierto parte del backend de Triton, pero el conjunto de instrucciones de Jalapeño será altamente cerrado, creando un efecto de bloqueo similar al del TPU de Google.
Impacto en la cadena de suministro
- La cadena de suministro de Jalapeño se divide de la siguiente manera:
- Aguas arriba: El diseño del chip depende de las herramientas EDA de Synopsys y Cadence; los núcleos de propiedad intelectual podrían provenir de ARM (unidad de control de CPU) o SiFive (coprocesador RISC-V).
- Aguas intermedias: La fabricación de obleas probablemente correrá a cargo de TSMC o Samsung. Dada la larga colaboración de Broadcom con TSMC (por ejemplo, en aceleradores de IA de 5 nm), TSMC es la opción más probable. El empaquetado podría utilizar CoWoS o InFO, lo que reduciría aún más la capacidad de NVIDIA.
- Aguas abajo: La integración del sistema la realiza Celestica, pero OpenAI está construyendo sus propios centros de datos (con planes de implementación para finales de 2026), reduciendo su dependencia de Microsoft Azure.
Beneficiarios: Broadcom (aumento significativo de ingresos por chips personalizados, se estima que cada Jalapeño genera entre 50 y 80 USD adicionales), Celestica (ensamblaje de sistemas), TSMC (llenado de capacidad de procesos avanzados), y proveedores de sustratos de empaquetado y pruebas. Afectados: NVIDIA (pérdida del mercado de inferencia de OpenAI, impacto limitado a corto plazo pero con un fuerte efecto de demostración), Microsoft (Azure pierde carga de trabajo principal de IA, el crecimiento de servicios en la nube se ve presionado), y otras empresas de IA (presión competitiva por la diferenciación de hardware).
Panorama competitivo#### NVIDIA: Sin preocupaciones a corto plazo, presión a largo plazo Las GPU de NVIDIA aún mantienen una posición de monopolio en el ámbito del entrenamiento (cuota de mercado superior al 80%), y la plataforma Vera Rubin está completamente disponible. Sin embargo, la salida de OpenAI podría desencadenar una reacción en cadena: si Google, Anthropic, Meta y otros aumentan aún más la proporción de chips de diseño propio, NVIDIA perderá el mercado de inferencia de alto margen. No obstante, la ventaja de NVIDIA reside en la adherencia del ecosistema CUDA: cualquier chip nuevo necesita años de adaptación a los marcos de modelos, mientras que NVIDIA sigue consolidando su foso con bibliotecas de aceleración (como cuDNN, TensorRT).
#### Broadcom: El salto de chips de conexión a núcleo de IA Anteriormente, Broadcom se centraba principalmente en chips de red (conmutadores, PHY) y ASIC personalizados (como los chips auxiliares de la TPU de Google). Con Jalapeño se convierte por primera vez en proveedor principal de chips centrales de IA, lo que marca la transición hacia áreas de alto valor añadido. Sin embargo, existe el riesgo de una dependencia excesiva de un único cliente (OpenAI), y debe competir con fabricantes de chips personalizados como Marvell y MediaTek.
#### Google TPU: Un modelo de negocio validado La TPU de Google ha iterado hasta la sexta generación, ofreciendo servicios de inferencia a través de GCP. Su ventaja radica en la integración integral de hardware y software de extremo a extremo (modelos propios + chips propios + nube propia). El seguimiento de OpenAI demuestra que este modelo se ha convertido en un estándar para las empresas de IA, pero Google tiene una clara ventaja de ser el primero.
- #### WiMi y los chips chinos: Diferenciación como vía de escape
- La empresa china WiMi (Wei Mei Quan Xi) está desarrollando clústeres de chips de IA y IA cuántica, pero su enfoque sigue estando en la informática de borde y escenarios verticales como el AR holográfico. El caso de OpenAI muestra que el desarrollo de chips propios requiere enormes gastos de capital (miles de millones de dólares) y una inversión a largo plazo. Para que las empresas chinas de IA compitan en el ámbito de la inferencia general, deben depender de procesos avanzados de fundiciones nacionales (como SMIC), pero actualmente están dos generaciones por detrás en tecnología. Por lo tanto, es más probable que WiMi y otras empresas se centren en ASIC para escenarios específicos (como bajo consumo, inferencia en el borde), utilizando modelos de código abierto (como Llama) para construir diferenciación.- Estados Unidos: Refuerza la autosuficiencia en hardware de IA, pero agrava la competencia por talentos en semiconductores (especialmente diseñadores de ASIC).
- Taiwán (China): La posición de TSMC como fundición se consolida aún más, pero la concentración de pedidos aumenta; si ocurre un evento geopolítico, la cadena de suministro global de IA corre el riesgo de interrupción.
- Corea del Sur: Samsung podría perder pedidos de OpenAI (debido a la competencia con TSMC), pero puede buscar otros clientes de chips personalizados.
- Japón: Perseguidores de procesos avanzados como Rapidus obtienen una ventana de oportunidad, pero a corto plazo es difícil ingresar.
- Europa: La demanda de litografía ASML se ve impulsada aún más, pero los beneficiarios de los subsidios de la Ley de Chips de la UE podrían exigir retornos (por ejemplo, producción local).
- Sudeste Asiático: La planta de Celestica en Malasia se beneficiará de pedidos de integración de sistemas, pero con bajo contenido tecnológico y valor añadido limitado.
Perspectiva de Inversión
- Corto plazo: Las acciones de NVIDIA están bajo presión pero con una corrección limitada (la demanda de entrenamiento continúa); Broadcom recibe una mejora de calificación de compra; los ADR de TSMC se mantienen estables debido a la capacidad completa.
- Largo plazo: El mercado de chips de IA pasará de "dominio exclusivo de GPU de propósito general" a "diferenciación heterogénea". La inversión debe centrarse en:
- - Servicios de diseño de chips personalizados (Broadcom, Marvell, MediaTek)
- - Empaquetado e interconexión avanzados (TSMC, JCET, Shanghai Microelectronics)
- - Interconexión óptica para centros de datos (Broadcom, InnoLight)
- - Startups de chips de entrenamiento alternativos a GPU (como Groq, Cerebras)
Perspectiva a Largo Plazo
Próximos 3 años: Despliegue a escala de OpenAI Jalapeño; NVIDIA mantiene el liderazgo en entrenamiento con Vera Rubin; el mercado de inferencia se fragmenta. Próximos 5 años: Casi todos los gigantes de IA (Google, Microsoft, Meta, Amazon, OpenAI) tienen chips de inferencia propios; NVIDIA se transforma en proveedor de plataforma de entrenamiento + conectividad. Próximos 10 años: Los dispositivos de IA en el borde (teléfonos, automóviles, robots) comienzan a adoptar NPU dedicados; la participación de GPU de propósito general en centros de datos cae por debajo del 50%.
Análisis de la cadena industrial completa
Cadena ascendente: EDA y PI - Synopsys y Cadence experimentan un aumento en la demanda de diseño de chips personalizados, pero su modelo de cobro por asiento se ve desafiado (expansión de equipos de diseño interno de empresas de chips). - La arquitectura ARM podría ser erosionada por RISC-V (si OpenAI adopta ISA de código abierto para reducir costos).### Medio: Fundición de obleas y encapsulado - La capacidad de 5nm/3nm de TSMC sigue siendo ajustada, y la capacidad de encapsulado CoWoS no se aliviará antes de 2027. - Samsung Foundry necesita acelerar la adquisición de clientes de chips personalizados, de lo contrario será marginada. - Los fabricantes de encapsulado y prueba como JCET y Tongfu Microelectronics se beneficiarán de la demanda de producción en masa de chips de IA nacionales (como Cambricon y Hygon).
Aguas abajo: Computación en la nube y servicios de IA - Microsoft Azure pierde la carga de trabajo principal de OpenAI, pero puede recuperar parte de los ingresos ofreciendo servicios de alojamiento del clúster Jalapeño. - El modelo autosuficiente de Google Cloud se convierte en referencia, atrayendo a otras empresas a imitarlo (como Oracle, IBM). - Las pequeñas y medianas empresas de IA se enfrentan a un "dilema de elección de chips": alquilar GPU es caro, desarrollar chips propios tiene un alto umbral, y pueden recurrir a FPGA o ASIC de compra directa.
Conclusión
El lanzamiento de OpenAI Jalapeño no es un evento de producto único, sino una señal de que la industria de la IA ha entrado en una era de "integración de infraestructura" desde la "innovación algorítmica". Su impacto en la cadena industrial es profundo: auge de los proveedores de diseño de ASIC personalizados, demanda insatisfecha de encapsulado avanzado, y aceleración de la diferenciación regional de la cadena de suministro. Para los inversores, se debe prestar atención a la lógica de inversión en "infraestructura de IA" en lugar de "modelos de IA"; para las empresas chinas, es necesario lograr un acoplamiento profundo entre ASIC y la pila de software en escenarios específicos, en lugar de perseguir potencia de cálculo genérica. Quien controle el control de la cadena de suministro de potencia de cálculo de bajo costo, alta estabilidad y cero emisiones de carbono, tendrá la voz dominante en la industria global de IA. Sin embargo, cabe señalar que el éxito de Jalapeño depende del rendimiento de producción en masa y la madurez del ecosistema de software; su verdadero impacto se manifestará después de 2027.
Contexto de redacción · semiconreport
semiconreport sitúa esta nota en Semicon Report sigue diseño de chips, fabricación, demanda de cómputo de IA, cadenas de suministro, ciclos.... fechas, nombres y cambios de estado aún requieren comprobación: los Enlaces de fuentes deben abrirse antes de reutilizar el resumen. Industria de chips / Brief industrial / Foco explica el ángulo editorial local.