OpenAI と Broadcom が LLM 最適化推論チップを発表
OpenAI と Broadcom は、大規模言語モデルの推論処理に特化した新しい半導体チップを共同で発表し、インフラ効率化への新たな取り組みを示した。
キーポイント
LLM 推論特化型チップの開発
OpenAI と Broadcom が協力して、大規模言語モデルの推論処理に最適化された専用半導体チップを開発・発表した。
インフラ効率とコスト削減
この新チップは、従来の汎用 GPU 相比で推論速度の向上とエネルギー効率の改善を目的としており、運用コスト削減に寄与する。
大手 AI と半導体企業の連携強化
AI ソフトウェアリーダーである OpenAI が、ハードウェアベンダー Broadcom と直接提携することで、自社要件に合わせた最適化を追求している。
影響分析・編集コメントを表示
影響分析
この発表は、AI モデルの爆発的な普及に伴う計算資源のボトルネック解消に向けた具体的な解決策を示すものであり、業界全体がハードウェア最適化へシフトしていることを示唆しています。OpenAI が自社要件に合わせた専用チップを開発することで、競合他社との差別化や運用コストの劇的削減が可能となり、LLM 推論市場のパラダイムシフトを加速させる可能性があります。
編集コメント
OpenAI が自社モデルの効率化のためにハードウェアベンダーと直接提携したことは、AI インフラにおける垂直統合戦略の典型例と言えます。この動きは、今後他の大手 AI 企業も同様の専用チップ開発を加速させるきっかけとなる可能性があります。
- 初期テストでは、第1世代アクセラレータが現在の最先端技術と比較してワットあたりの性能を大幅に上回ることが示されています
- 業界全体における現在および将来の LLM(大規模言語モデル)のためにゼロから構築されました
- OpenAI のモデルによって加速され、設計から生産まで9ヶ月で開発されました
- プロダクトからモデル、そして今やチップに至るまで、OpenAI のフルスタックプラットフォームを拡大します
- 複数の世代にわたり、データセンターパートナーと共にギガワット規模で展開されます
OpenAI と Broadcom(NASDAQ: AVGO)は本日、OpenAI の最初のインテリジェンスプロセッサ「Jalapeño」を発表しました。これは OpenAI が描く LLM インフラの未来を基盤としたアクセラレータであり、両社が共同で構築している多世代コンピューティングプラットフォームにおける最初の AI アクセラレータです。このプラットフォームは、高度な AI をより高速に、より信頼性高く、より多くの人々にアクセス可能にするために設計されています。

Jalapeño は、Broadcom の社長兼 CEO である Hock Tan とプレジデントの Charlie Kawwas から、OpenAI の CEO Sam Altman とプレジデント Greg Brockman に引き渡されました。これは、モデルと製品の背後にあるフルスタックを構築するという OpenAI の戦略における重要な一歩です。
OpenAI は、LLM の基本原理に対する深い理解に基づき、モデルのロードマップ、カーネル、サービングシステム、製品要件から得た知見を踏まえ、チップをゼロから設計しました。この取り組みには Broadcom と Celestica がパートナーとして加わり、チップの実装、基板、ラックシステムの統合、高性能ネットワーク、スケーラブルな生産システムを通じてプラットフォームの産業化を支援しています。Jalapeño は、業界全体における現在および将来の AI モデルの推論ニーズに対する OpenAI の洞察に基づき、すべての LLM と柔軟に動作するように設計されています。Jalapeño チップのエンジニアリングサンプルは、GPT‑5.3‑Codex‑Spark を含む ML ワークロードを、生産目標となる周波数と電力でラボ内で実行しています。
OpenAI は最終的な性能測定をまだ行っている最中ですが、初期テストでは、Jalapeño が現在の最先端技術と比較してワットあたりのパフォーマンスが大幅に向上することが示されています。パフォーマンスに関する詳細な技術報告書は、今後数ヶ月以内に発表される予定です。このアーキテクチャはデータ移動を削減し、計算、メモリ、ネットワークリソースのバランスを取ることで、理論上のピーク性能に近い実現可能な利用率を実現します。Broadcom のシリコン実装および Tomahawk ネットワークシリコンを含むネットワーク技術が、このプラットフォームの大規模生産への実現を支えています。
「世界は計算能力を基盤とした経済へと移行しています」と、OpenAI の社長兼共同創設者であるグレッグ・ブロックマン氏は述べました。「Jalapeño は、計算資源をより豊富にし、その結果として AI をより高速で、より信頼性が高く、個人や企業にとってより手頃な価格にするとともに、より重要な問題の解決に活用できるようにするための、当社の長期的なフルスタックインフラストラテジーの一部です。スタックのより多くの部分を自社で設計することで、より高い効率性でより多くの知能を提供し、高度な AI をより広範なアクセスへと押し進めていくことができます。」
「Jalapeñoは、OpenAIの研究者との緊密な協力から得た詳細な知見に基づき、LLM推論のためにゼロから設計されました」と、OpenAIのハードウェアプログラムを率いるRichard Ho氏は述べています。「私たちは、最先端のAIモデルにとって最も重要なカーネル(計算核)、メモリアクセス、ネットワーク、そしてサービングパターンを中心にアーキテクチャを最適化しました。初期テストに基づくと、Jalapeñoは最も重要なワークロードを、ハードウェアの理論限界に近い形で効率的に実行できるでしょう。」
「OpenAI との協業は、今後10年間の AI に必要な物理インフラを拡張するための根本的なコミットメントを表しています」と Broadcom の社長兼 CEO であるホック・タン氏は述べています。「これは多世代にわたるロードマップの始まりに過ぎません。業界をリードする半導体を OpenAI と共同開発することで、2026 年からマイクロソフトや他のパートナーと共にギガワット規模のデータセンターの展開を可能にします。」
LLM 向けの最適化された推論プラットフォームとして設計
Jalapeño は、現代の LLM 推論のための白紙状態から設計されたアーキテクチャであり、以前の AI ワークロードから派生した汎用アクセラレータではありません。これは OpenAI が ChatGPT、Codex、API、そして将来のエージェント型製品で日常的に運用しているシステムに基づいており、同時に業界全体における現在および将来の LLM にも対応するように設計されています。その目的は、今日の最先端 AI アクセラレータのパワーとスループットを、最も高速な専用推論システムに近いレイテンシと組み合わせることで、Jalapeño を大規模なインタラクティブ型 LLM プロダクトに最適化することです。
これがフルスタックにおける優位性です。OpenAI は最先端モデルの開発やその上での製品構築だけでなく、それらを支えるインフラストラクチャの設計にも取り組んでいます:チップアーキテクチャ、カーネル、メモリシステム、ネットワーク、スケジューリング、デプロイメントシステム、そしてプロダクト体験です。OpenAI がスタック全体にわたって運営しているため、各レイヤーは同じ目標を中心に最適化されます:ユーザーにとってモデルをより高速に、より信頼性が高く、より手頃な価格にすること。
Jalapeño は現代の LLM 推論のための白紙状態から設計されたアーキテクチャであり、以前の AI ワークロードから派生した汎用アクセラレータではありません。これは OpenAI が ChatGPT、Codex、API、そして将来のエージェント型製品で日常的に運用しているシステムに基づいており、同時に業界全体における現在および将来の LLM にも対応するように設計されています。その目的は、今日の最先端 AI アクセラレータのパワーとスループットを、最も高速な専用推論システムに近いレイテンシと組み合わせることで、Jalapeño を大規模なインタラクティブ型 LLM プロダクトに最適化することです。
これがフルスタックにおける優位性です。OpenAI は最先端モデルの開発やその上での製品構築だけでなく、それらを支えるインフラストラクチャの設計にも取り組んでいます:チップアーキテクチャ、カーネル、メモリシステム、ネットワーク、スケジューリング、デプロイメントシステム、そしてプロダクト体験です。OpenAI がスタック全体にわたって運営しているため、各レイヤーは同じ目標を中心に最適化されます:ユーザーにとってモデルをより高速に、より信頼性が高く、より手頃な価格にすること。
Jalapeño は、OpenAI の進展を支えるフライングホイールを強化します。より優れたインフラは計算効率を高め、高い計算効率はより良いトレーニングとサービス提供を可能にし、最終的にさらに能力の高い AI モデルを駆動します。より優れたモデルは、人々、開発者、企業にとってより良い製品となり、それらがさらなる利用、顧客、収益を生み出し、OpenAI が次世代のインフラに再投資できる環境を作ります。時が経つにつれて、このサイクルは、すべての人にとって知能をより能力高く、より信頼性の高いものにし、コストも低下させます。
9 か月のテープアウト、OpenAI モデルによって加速
Jalapeño は、初期設計から製造用テープアウトまでわずか 9 ヶ月で共同開発され、このカスタム AI アクセラレータプログラムは、高性能な先進半導体において達成された中で最も迅速な ASIC(特定用途向け集積回路)開発サイクルであると私たちが信じているものです。この速度は、OpenAI のエンジニアリングチームとの深いソフトウェアとハードウェアの共開発、Broadcom のシリコン実装における専門知識、および設計と最適化プロセスの一部を加速するために OpenAI モデルを活用した結果を反映しています。
ユーザーに提供されている同じモデルが、将来のモデルを実行するインフラの改善にも貢献しています。AI がエンジニアにより良いチップをより迅速に設計することを支援できるのであれば、それは業界全体の計算コストを引き下げ、先進 AI へのアクセスを民主化する手助けとなります。
パートナーと多世代プラットフォームの構築
Jalapeño は、2026 年末までに初期展開が行われ、その後の数年間で拡大していくことを目指した多世代の計算プラットフォームにおける最初のステップです。これは、OpenAI が設計したアクセラレーターと Broadcom のシリコン実装、ネットワークおよび接続技術、そして Celestica の基板・ラック・システムに関する専門知識を組み合わせるものです。
高度な AI をより広く利用可能にする
この取り組みの目的は単純です:推論こそが AI が人々に届く場所であるということです。コスト、速度、信頼性のあらゆる改善は、より高速な ChatGPT の回答、より多くのステップを待ち時間なしで実行できる Codex のタスク、構築コストが低い API プロダクト、あるいは需要が高い時でもより信頼性の高いアクセスとして現れます。
AI の民主化とは、高度なモデルをより多くの人々が毎日利用できるよう、利用可能かつ信頼性が高く、手頃な価格にすることです。Jalapeño は、OpenAI がそのインフラのより多く部分を、学生、開発者、中小企業、研究者、企業、そして学び、創造し、困難な問題を解決しようとするすべての人にとって有用な知能へと転換するのを助けます。
原文を表示
- Early testing shows that the first-generation accelerator will deliver performance per watt substantially better than current state-of-the-art
- Built from the ground up for current and future LLMs across the industry
- Developed from design to production in nine months, accelerated by OpenAI’s models
- Expands OpenAI’s full-stack platform, from products to models and now to chips
- To be deployed at gigawatt scale with data center partners, over multiple generations
OpenAI and Broadcom (NASDAQ: AVGO) today unveiled Jalapeño, OpenAI’s first Intelligence Processor: an accelerator architected around OpenAI’s vision for the future of LLM inference, and the first AI accelerator in a multi-generation compute platform the companies are building together to make advanced AI faster, more reliable, and more accessible to more people.

Jalapeño was delivered to OpenAI CEO Sam Altman and President Greg Brockman by Broadcom President and CEO Hock Tan and President Charlie Kawwas, marking an important step in OpenAI’s strategy to build the full stack behind its models and products.
OpenAI designed the chip from scratch around its deep understanding of LLM fundamentals, informed by its roadmap of models, kernels, serving systems, and product needs, with partners Broadcom and Celestica, helping industrialize the platform through chip implementation, board, rack system integration, high-performance networking, and scalable production systems. Jalapeño is designed with flexibility to work with all LLMs guided by OpenAI’s insights into the inference needs of current and future AI models across the industry. Engineering samples of the Jalapeño chip are running ML workloads in the lab at production target frequency and power, including GPT‑5.3‑Codex‑Spark.
While OpenAI is still measuring final performance, early testing shows that Jalapeño will deliver performance per watt substantially better than current state-of-the-art. A detailed technical report on performance will be presented in the coming months. The architecture reduces data movement and balances compute, memory, and networking resources to achieve realized utilization much closer to theoretical peak performance. Broadcom’s silicon implementation and networking technologies, including Tomahawk networking silicon, help bring the platform to large-scale production.
“The world is moving to a compute-powered economy,” said Greg Brockman, President and Co-Founder of OpenAI. “Jalapeño is part of our long-term full-stack infrastructure strategy to make compute more abundant, resulting in AI which is faster, more reliable, more affordable for people and businesses, and can be used to solve more important problems. By designing more of the stack ourselves, we can serve more intelligence with greater efficiency and keep pushing advanced AI toward broader access.”
“Jalapeño was designed from the ground up for LLM inference using detailed insights from our close collaboration with OpenAI researchers,” said Richard Ho, who leads OpenAI’s hardware program. “We optimized the architecture around the kernels, memory movement, networking, and serving patterns that matter most for frontier AI models. Based on early testing, Jalapeño will efficiently execute our most important workloads close to the hardware’s theoretical limits.”
“Our collaboration with OpenAI represents a fundamental commitment to scaling the physical infrastructure required for the next decade of AI,” said Hock Tan, President and CEO, Broadcom. “This is just the beginning of a multi-generation roadmap. By co-developing our industry-leading silicon directly with OpenAI, we are enabling the deployment of gigawatt scale data centers with Microsoft and other partners beginning in 2026.”
Designed to be the best inference platform for LLMs
Jalapeño is a blank-slate design for modern LLM inference, not a general-purpose accelerator adapted from earlier AI workloads. It is informed by the systems OpenAI runs every day across ChatGPT, Codex, the API, and future agentic products, while also being designed for current and future LLMs across the industry. The goal is to combine the power and throughput of today’s leading AI accelerators with latency closer to the fastest specialized inference systems, making Jalapeño well suited for interactive LLM products at scale.
That is the full-stack advantage. OpenAI is not only developing frontier models or building products on top of them; it is designing the infrastructure underneath them: chip architecture, kernels, memory systems, networking, scheduling, deployment systems, and product experience. Because OpenAI operates across the stack, each layer can be optimized around the same goal: making its models faster, more reliable, and more affordable for users.
Jalapeño strengthens the flywheel behind OpenAI’s progress. Better infrastructure drives compute efficiency. Greater compute efficiency enables better training and serving, ultimately powering more capable AI models. Better models become better products for people, developers, and businesses. Better products drive more usage, more customers, and more revenue, which lets OpenAI reinvest in the next generation of infrastructure. Over time, that cycle helps make intelligence more capable, more reliable, and less expensive for everyone.
Nine-month tape-out, accelerated by OpenAI models
Jalapeño was co-developed from initial design to manufacturing tape-out in just nine months, and the custom AI accelerator program represents what we believe to be the fastest ASIC development cycle ever achieved in high-performance advanced semiconductors. That speed reflects deep software-hardware co-development with OpenAI’s engineering teams, Broadcom’s silicon implementation expertise, and the use of OpenAI models to accelerate parts of the design and optimization process.
The same models served to users are helping improve the infrastructure used to run future models. If AI can help engineers design better chips faster, it can lower the cost of compute across the industry and help democratize access to advanced AI.
Building a multi-generation platform with partners
Jalapeño is the first step in a multi-generation compute platform designed for initial deployment by the end of 2026 and expanding in the years ahead, combining OpenAI-designed accelerators with Broadcom silicon implementation, networking, and connectivity technologies; and Celestica’s board, rack, and system expertise.
Making advanced AI more broadly available
The point of this work is simple: inference is where AI reaches people. Every improvement in cost, speed, and reliability can show up as a faster ChatGPT answer, a Codex task that can take more steps with less waiting, an API product that is cheaper to build, or more dependable access when demand is high.
Democratizing AI means making advanced models available, dependable, and affordable enough for more people to use every day. Jalapeño helps OpenAI turn more of its infrastructure into useful intelligence for students, developers, small businesses, researchers, enterprises, and anyone trying to learn, create, or solve hard problems.
関連記事
OpenAI、Broadcomと共同開発した初のAI専用プロセッサ「Jalapeño」を発表
OpenAIは Broadcom と共同で開発した AI サーバー用専用チップ「Jalapeño」を公開しました。この ASIC は大規模言語モデルの推論処理に特化しており、同社の次世代モデルを支える基盤となります。
サムスン、AI 制限解除後 ChatGPT Enterprise と Codex の利用を従業員に開放
サムスン電子は韓国全社および DX 部門の全世界従業員に対し、技術・非技術業務で AI ツールの利用範囲を広げるため、ChatGPT Enterprise と Codex のアクセス権限を開放した。
OpenAI、ChatGPT向け双方向音声モードの展開を準備
OpenAIは、アシスタントが同時に話しかけ、聞き取り、応答できる新音声生成モデル「Bidi 1」をChatGPTに導入し、会話の流れを維持しながら中断時に即座にタスクを切り替える機能をロールアウトしている。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み