AI & pengkomputeran
Pelancaran cip inferens pertama buatan sendiri OpenAI, Jalapeño: Anjakan paradigma dan penstrukturan semula persaingan dalam rantaian industri pengkomputeran AI
Analisis mendalam tentang kesan mendalam cip inferens AI pertama yang dibangunkan sendiri, Jalapeño, yang diterbitkan bersama oleh OpenAI dan Broadcom ke atas rantaian industri semikonduktor, hala tuju teknologi, landskap persaingan pasaran, dan rantaian bekalan serantau.
Gambaran Keseluruhan Acara
Pada 24 Jun 2026, OpenAI dan Broadcom bersama-sama melancarkan cip penaakulan AI buatan sendiri pertama mereka—Jalapeño. Cip ini merupakan litar bersepadu khusus (ASIC) yang dioptimumkan untuk penaakulan model bahasa besar, dengan OpenAI mereka bentuk seni bina peringkat asas, Broadcom bertanggungjawab untuk pelaksanaan silikon dan perkakasan rangkaian, manakala Celestica, syarikat perkhidmatan pembuatan elektronik Kanada, menguruskan integrasi papan dan sistem rak. OpenAI mendakwa bahawa nisbah kecekapan tenaga (prestasi/kuasa) Jalapeño akan mengatasi tahap paling maju semasa, dengan sampel kejuruteraan telah pun menjalankan model seperti GPT-5.3, Codex, dan Spark di makmal pada frekuensi dan penggunaan kuasa sasaran pengeluaran.
Acara ini tidak berlaku secara terpencil. Pada hari yang sama, CEO NVIDIA, Jensen Huang, menekankan bahawa "era AI praktikal" telah tiba dalam mesyuarat agung tahunan, dan mendedahkan bahawa platform Vera Rubin telah memasuki pengeluaran penuh. Google, melalui siri TPU tersendiri, menunjukkan kelebihan keuntungan yang ketara dalam kawalan kos kuasa pengiraan dan pengoptimuman sinergi perisian-perkakasan, manakala Anthropic terikat rapat dengan infrastruktur kuasa pengiraan Amazon dan Google. "Perlumbaan senjata" dalam bidang pengkomputeran AI beralih daripada skala model kepada kawalan autonomi infrastruktur kuasa pengiraan.
Latar Belakang: Laluan Tidak Dapat Dielakkan daripada Sewa Kuasa Pengiraan kepada Cip Buatan Sendiri
Pada peringkat awal, OpenAI bergantung sepenuhnya kepada GPU NVIDIA dalam kluster Azure Microsoft untuk latihan dan penaakulan, mengekalkan kedudukan utama melalui "menukar modal kepada kuasa pengiraan". Walau bagaimanapun, dengan pertumbuhan eksponen bilangan parameter siri model GPT (GPT-5.3 dijangka melebihi seratus trilion parameter), kos penaakulan meningkat secara mendadak. Menurut anggaran industri, kos elektrik untuk satu sesi penaakulan model peringkat GPT-4 telah melebihi 30% daripada perbelanjaan operasi. Pada masa yang sama, bekalan GPU NVIDIA terus tegang, dengan keutamaan peruntukan kapasiti pengeluaran seni bina Blackwell condong kepada pengendali awan berskala besar, menyebabkan syarikat AI kecil dan sederhana menghadapi kesukaran "menunggu bekalan".
Dalam konteks ini, pembangunan cip penaakulan sendiri oleh OpenAI menjadi lanjutan semula jadi strategi infrastruktur penuh tindanan jangka panjang. Kedudukan Jalapeño bukanlah untuk menggantikan sepenuhnya GPU NVIDIA, tetapi untuk memberi tumpuan kepada senario penaakulan—iaitu bahagian paling mahal dan paling kerap dalam penggunaan AI. Melalui ASIC tersuai, OpenAI dijangka dapat meningkatkan kecekapan tenaga penaakulan sebanyak 3-5 kali ganda (berdasarkan pengalaman reka bentuk seumpamanya), dengan itu mengurangkan kos marginal secara mendadak.
Analisis Mendalam
Kesan TeknologiJalapeño ialah ASIC yang dikhususkan untuk inferens, dengan laluan teknikal yang berbeza asas daripada GPU: - Seni Bina: Mengguna pakai seni bina aliran data dan bukannya SIMT, dengan pengerasan untuk pendaraban matriks dan mekanisme perhatian model Transformer. Ini mengelakkan overhed yang disebabkan oleh unit pengkomputeran tujuan umum dalam GPU, tetapi mengorbankan fleksibiliti. - Proses: Nod khusus tidak didedahkan, tetapi mengikut amalan industri, Broadcom biasanya menggunakan proses 5nm atau 3nm TSMC. Jika menggunakan 3nm, ia perlu bersaing untuk kapasiti dengan pelanggan seperti Apple dan NVIDIA. - Sambungan: Komunikasi antara cip bergantung pada suis siri Tomahawk Broadcom dan teknologi silikon fotonik tersuai, menyokong penggunaan kluster berskala besar. Ini bersaing secara langsung dengan NVLink NVIDIA.
Halangan teknikal terletak pada: pengkompil dan masa jalan ASIC inferens perlu digandingkan secara mendalam dengan timbunan perisian OpenAI (seperti Triton, PyTorch). OpenAI telah membuka sumber sebahagian bahagian belakang Triton, tetapi set arahan Jalapeño akan menjadi sangat tertutup, membentuk kesan penguncian perkakasan-perisian serupa dengan TPU Google.
Kesan Rantaian Bekalan
- Pembahagian rantaian bekalan Jalapeño adalah seperti berikut:
- Huluan: Reka bentuk cip bergantung pada alat EDA Synopsys dan Cadence; teras IP mungkin datang daripada ARM (unit kawalan CPU) atau SiFive (kopemproses RISC-V).
- Pertengahan: Fabrikasi wafer kemungkinan besar dijalankan oleh TSMC atau Samsung. Berdasarkan kerjasama jangka panjang Broadcom dengan TSMC (seperti pemecut AI 5nm), TSMC lebih berkemungkinan. Pembungkusan mungkin menggunakan CoWoS atau InFO, seterusnya menyempitkan kapasiti NVIDIA.
- Hiliran: Integrasi sistem disiapkan oleh Celestica, tetapi OpenAI membina pusat datanya sendiri (contohnya, rancangan penggunaan menjelang akhir 2026), mengurangkan pergantungan pada Azure Microsoft.
Pihak yang mendapat manfaat: Broadcom (pendapatan cip tersuai meningkat dengan ketara, dianggarkan setiap Jalapeño membawa peningkatan $50-80), Celestica (pemasangan sistem), TSMC (pengisian pesanan proses lanjutan), serta pengeluar papan pembungkusan dan ujian berkaitan. Pihak yang berisiko: NVIDIA (kehilangan pasaran inferens OpenAI, kesan jangka pendek terhad tetapi kesan demonstrasi kuat), Microsoft (Azure kehilangan beban kerja AI utama, pertumbuhan perkhidmatan awan tertekan), syarikat AI lain (menghadapi tekanan persaingan perbezaan perkakasan).
Landskap Persaingan#### NVIDIA: Tiada masalah dalam jangka pendek, tetapi tekanan dalam jangka panjang GPU NVIDIA masih mendominasi dalam latihan model (bahagian pasaran melebihi 80%), dan platform Vera Rubin telah dilancarkan sepenuhnya. Namun, pemergian OpenAI mungkin mencetuskan kesan domino: jika Google, Anthropic, Meta dan lain-lain terus meningkatkan bahagian cip rekaan sendiri, NVIDIA akan kehilangan pasaran inferens yang bermargin tinggi. Walau bagaimanapun, kelebihan NVIDIA terletak pada kelekatan ekosistem CUDA — mana-mana cip baru perlu mengambil masa bertahun-tahun untuk menyesuaikan dengan rangka kerja model, manakala NVIDIA terus mengukuhkan parit pertahanannya melalui perpustakaan pecutan (seperti cuDNN, TensorRT).
#### Broadcom: Peralihan daripada cip sambungan kepada Teras AI Sebelum ini, Broadcom terutamanya cip rangkaian (suis, PHY) dan ASIC tersuai (seperti cip bantuan TPU Google). Jalapeño menjadikannya pembekal utama cip utama AI buat pertama kali, menandakan peralihan ke bidang nilai tambah tinggi. Namun, kebergantungan berlebihan pada pelanggan tunggal (OpenAI) membawa risiko, dan ia perlu bersaing dengan pengeluar cip tersuai seperti Marvell dan MediaTek.
#### Google TPU: Model perniagaan yang telah terbukti TPU Google telah diulang sehingga generasi keenam, menyediakan perkhidmatan inferens melalui GCP. Kelebihannya terletak pada integrasi perisian dan perkakasan hujung ke hujung (model sendiri + cip sendiri + awan sendiri). Pengikut OpenAI menunjukkan bahawa model ini telah menjadi standard bagi syarikat AI, tetapi Google mempunyai kelebihan sebagai perintis yang jelas.
- #### WiMi dan cip China: Tembusan yang berbeza
- Syarikat China WiMi (Wei Mei Quan Xi) merancang kluster cip AI dan AI kuantum, tetapi tumpuannya masih pada pengkomputeran tepi dan AR holografik dalam senario menegak. Kes OpenAI menunjukkan bahawa pembangunan cip dalaman memerlukan perbelanjaan modal yang besar (berbilion dolar) dan pelaburan jangka panjang. Jika syarikat AI China ingin bersaing dalam bidang inferens umum, mereka mesti bergantung pada proses termaju dari fabrik dalam negeri (seperti SMIC), tetapi pada masa ini proses tersebut ketinggalan dua generasi. Oleh itu, WiMi dan lain-lain lebih cenderung untuk memberi tumpuan kepada ASIC untuk senario tertentu (seperti kuasa rendah, inferens hujung), menggunakan model sumber terbuka (seperti Llama) untuk membina pembezaan.- Amerika Syarikat: Memperkukuh autonomi dan kawalan perkakasan AI, tetapi meningkatkan persaingan bakat semikonduktor (terutamanya bakat reka bentuk ASIC).
- Taiwan, China: Kedudukan TSMC sebagai pengeluar kontrak semakin kukuh, tetapi kepekatan pesanan meningkat; jika berlaku peristiwa geopolitik, rantaian bekalan AI global berdepan risiko putus.
- Korea Selatan: Samsung mungkin kehilangan pesanan OpenAI (kerana persaingan dengan TSMC), tetapi boleh mendapatkan pelanggan cip tersuai lain.
- Jepun: Pengejar proses termaju seperti Rapidus mendapat tempoh peluang, tetapi sukar untuk menembusi dalam jangka pendek.
- Eropah: Permintaan untuk mesin litografi ASML terus meningkat, tetapi pihak yang memberi subsidi di bawah Akta Cip EU mungkin menuntut pulangan (seperti pengeluaran tempatan).
- Asia Tenggara: Kilang Celestica di Malaysia akan mendapat manfaat daripada pesanan integrasi sistem, tetapi kandungan teknologi rendah dan nilai tambah terhad.### Pertengahan: Pengilangan Wafer dan Pembungkusan
- Kapasiti 5nm/3nm TSMC terus kekal ketat, kapasiti pembungkusan CoWoS sukar diatasi sebelum 2027.
- Samsung Foundry perlu mempercepatkan pelanggan cip tersuai, jika tidak akan terpinggir.
- Pembekal pembungkusan dan ujian seperti JCET dan Tongfu Microelectronics akan mendapat manfaat daripada permintaan pengeluaran besar-besaran cip AI domestik (seperti Cambricon, Hygon).
Hiliran: Pengkomputeran Awan dan Perkhidmatan AI - Microsoft Azure kehilangan beban kerja utama OpenAI, tetapi boleh memperoleh semula sebahagian pendapatan dengan menyediakan perkhidmatan pengehosan kluster Jalapeño. - Model sara diri Google Cloud menjadi tanda aras, menarik syarikat lain untuk meniru (seperti Oracle, IBM). - Syarikat AI sederhana dan kecil menghadapi "dilema pilihan cip": sewa GPU mahal, halangan tinggi untuk membangunkan cip sendiri, mungkin beralih kepada FPGA atau ASIC beli terus.
Kesimpulan
Pelancaran OpenAI Jalapeño bukanlah acara produk tunggal, tetapi tanda era industri AI dari "inovasi algoritma" memasuki "penyatuan infrastruktur". Kesan rantaian industrinya mendalam: perkhidmatan reka bentuk ASIC tersuai bangkit, pembungkusan termaju sukar diatasi, rantai bekalan serantau semakin berpecah. Bagi pelabur, tumpuan harus pada "infrastruktur AI" bukan "model AI"; bagi syarikat China, perlu mencapai gandingan mendalam antara ASIC dengan timbunan perisian dalam senario tertentu, bukan mengejar kuasa pengkomputeran umum. Sesiapa yang menguasai kawalan rantai bekalan kuasa pengkomputeran kos rendah, kestabilan tinggi, dan sifar karbon, akan menguasai kata putus teras industri AI global. Walau bagaimanapun, kejayaan Jalapeño bergantung pada hasil pengeluaran besar-besaran dan kematangan ekosistem perisian, impak sebenarnya akan terserlah selepas 2027.
Konteks artikel · semiconreport
semiconreport meletakkan nota ini dalam Semicon Report menjejak reka bentuk cip, fabrikasi, permintaan pengkomputeran AI, perubahan rantaian bekala.... tarikh, nama dan perubahan status masih perlu disemak: Pautan sumber perlu dibuka sebelum ringkasan digunakan semula. Industri cip / Ringkasan industri / Fokus menerangkan sudut editorial setempat.