2026年中盤におけるオープンモデルへの私の予測
Interconnectsは、2025年後半から2026年にかけてオープンモデルとクローズドモデルの能力差が縮小しつつある現状を分析し、ベンチマークスコアだけでなく堅牢性や実利用における優位性を維持するクローズドモデルの市場支配が続く可能性を示唆している。
キーポイント
オープンモデルの追従能力
オープンモデルラボは確立されたベンチマークにおいて追従能力が高く、豊富な人材と計算資源のバランスによりこの傾向は続く。
クローズドモデルの隠れた優位性
同スコアのオープンモデルと比較し、クローズドモデルは測定困難な堅牢性や汎用性に優れており、知識労働者を支援する市場で支配的になる。
中国の戦略とディストillation
中国のオープンウェイトラボはベンチマークスコアに重点を置き、ディストillation技術を活用しているが、これは資金調達や採用のための叙事詩維持であり、能力バランスを決定する要因ではない。
供給と需要の分離
オープンモデルへの強い需要(個人、組織、主権国家)と、経済原則によって完全に支配される供給の間には乖離があり、どのビジネス戦略がオープンモデルの公開をサポートするかは未解決の問題である。
中国オープンモデルの資金難と能力格差
中国のオープンウェイトラボは今年後半に資金調達困難に直面し、3〜9ヶ月後に能力面での遅れが顕在化する見込みです。
クローズドモデルの優位性とオープンモデルの用途分化
ユーザーフィードバックに基づくオンラインRLを活用したクローズドモデルが高度な能力で優位に立ち、オープンモデルは反復的な自動化タスクやAPI市場での採用が進みます。
規制の不可能性と米国の採用回復
オープンモデルの ban は実質的に不可能であり、2027年初頭にはGoogle Gemma 4などの成功により米国がオープンモデル採用指標で回復すると予想されます。
影響分析・編集コメントを表示
影響分析
この分析は、オープンソースAIの未来が単なるベンチマークスコアの競争ではなく、実世界での堅牢性とビジネスモデルの持続可能性に依存していることを示唆しています。特に、クローズドモデルが「知識労働者」という高価値市場で優位性を維持する可能性は、企業におけるAI導入戦略の見直しを促す重要な示唆となります。
編集コメント
ベンチマークスコアだけでなく、実運用での堅牢性やビジネスモデルの持続可能性という多角的な視点からオープンとクローズドの優劣を論じた貴重な分析です。
私たちは、オープンモデルがクローズドなラボに追いつけるかどうかを学ぶ時期を生きている。明白な答えは「いいえ、追いつけない」というものだ。この答えは、あらゆる分野で追いつかないと述べる一種の表現である。この枠組みは、オープンモデルが完全に追いつくという人気のある予測を閉ざす。つまり、すべてのモデルが行き渡り、オープンモデルとクローズドモデルがますます類似していくというシナリオだ。この過程を経る中で、長期的な能力の安定したバランスが確立される時期が非常に不透明であることは明らかだ。
これは非常に複雑なダイナミクスであり、私たちが監視する核心はモデル間の能力ギャップである。同時に、このギャップはオープンモデルの資金調達における進化しつつある動態、誰がオープンモデルを構築するか、ファストフォローを可能にする蒸留(distillation)などの技術が新しい応用分野にどう転換されるか、オープンソース AI エコシステムを阻害する可能性のある規制、そして実際にオープンモデルを利用しているのは誰かといった要素と絡み合っている。
能力ギャップは、供給と需要を異なる形状へと押しやる複雑な力の海における一つのシグナルに過ぎない。多くの場合、需要(もちろん、無数の個人、組織、主権国家がオープンモデルを望み、必要としている)は、供給から大きく分離されている。供給は完全に経済によって決定される。「どのビジネス戦略がオープンモデルの公開をサポートするか」という問いはまだ決着がついていない。
Interconnects AI は読者支援型の出版物です。新しい投稿を受け取り私の活動をサポートするには、購読をご検討ください。
この複雑さの中で、私の主要な信念を明確なリストに要約したいと考えました。これらは、今春にオープンモデルについて私が執筆または録音した 10 件以上の記事(随所に関連リンクがあります)の延長線上にあります。
計算資源の違いに基づけば、特に 2025 年後半から今日に至るまで、トップクラスのクローズドモデルがオープンモデルに対して能力面で着実に差を広げていないことは驚きです。
オープンモデルを開発するラボは、確立されたベンチマークにおいて技術的に非常に強く、追従を続けています。これは、豊富な人材と十分な計算資源のバランスの結果であり、今後も続くでしょう。
中国のオープンウェイト(重み公開)ラボは、米国の同規模クローズドラボと比較して、ややベンチマークスコアに重点を置いています。蒸留(distillation)技術はこの点で中国の大規模言語モデル(LLM)企業を支援しますが、万能薬ではありません。蒸留ダイナミクスの変化(例えば規制など)が能力バランスを決定づける要因になることはありません。この焦点のシフトは、フロンティアとの追走という物語を維持し続けるインセンティブの自然な進化であり、資金調達と採用にとって極めて重要です。
現時点では、クローズドモデルは同程度のスコアを持つオープンモデルよりも堅牢で、一般的に有用である傾向があります。クローズドモデルには、現在のまたは過去のベンチマークでは十分に捉えられていない、測定が難しい特定の性質を備えています。これは、個々のユーザーが絶えず新たな課題を提示する市場(つまり、知識労働者を直接アシスタントとして支援する分野)において、クローズドモデルが支配的な地位を確立するための鍵となります。
ベンチマークを通じて監視されているオープンモデルとクローズドモデルの競争は、市場構造が制約されるまで、主に経済的な持続力と迅速な追従のゲームとなるでしょう。私は、中国のオープンウェイトラボがまず資金難に直面し、今年後半にはそれが顕在化すると予想しています。資金難は、3〜9 ヶ月後に異なる能力軌道において現れることになります。
RL(強化学習)が支配するトレーニング時代は、継続的な能力向上における重要な要因として、実世界のユースケースへの適合性の重要性を高めています。これらは、ユーザーがエージェントを使って Claude Code や Codex といったツールを直接利用し、職務上の問題を解決するタスクです。これは、クローズドラボがオープンウェイトモデルに対して能力面で優位性を確立できる最初の明確な技術領域であり、ユーザーフィードバックに基づいたオンライン RL(強化学習)を直接的に活用する可能性があります。
オープンモデルは、エコシステム全体における反復的なタスクの API 市場における相対シェアとして測定されるように、反復自動化タスクにおいてますます採用されていくでしょう。これは、多くの新しい AI ネイティブアプリケーションやビジネスバックエンドの自動化などの形で現れます。この成功が、ドメイン固有で効率的なオープンモデルへのさらなる投資を促進することになります。
これは複雑な図景であり、長期的な軌道は能力の問題というよりも経済的な問題です。多くの他のメディアは、「中国は間違いなく AI において我々を追い抜く」というより単純な物語を描き、それがシンプルなストーリーであるためより多くの拡散を得ています。しかし現実は複雑です。真の AI 収益がさらなる投資を生み出し、最終的には急速にモデルを改善し続ける能力と結びつくことになります。経済的な現実はまだ、一般的なカテゴリとしてのオープンモデルのスケーリングには影響を及ぼしていません。
シェア
この経済に焦点を当てた視点は、より広範なオープンモデルエコシステムにおける私の立場に関連しています。
特定の種類のオープンモデルを禁止するよう繰り返し呼びかける声は続くでしょうが、実際の実施は不可能です。強力な AI モデル(つまりフロンティアに近いがまだ到達していないもの)のトレーニングは、大規模展開と比較して相対的に小さなコストです。例えば、米国がある計算能力の閾値を超えてオープンモデルを禁止した場合、別の主権实体が最終的にそれらをトレーニングし公にリリースし、モデルはより少ない監督の下で米国市場に流入することになります。
オープンモデルに対する影響力の第 2 次導関数は変化しており、米国は 2027 年初頭からオープンモデルの採用指標において徐々に地盤を回復していくでしょう(中国の速度が鈍化し、その後反転するには長い時間がかかります)。例としては、Google の Gemma 4(大成功)、Nvidia の Nemotron、および Arcee AI が挙げられます。
閉鎖型モデルがこれまで以上に強力に構築され、プレビューされ、リリースされるにつれ、最強の AI モデルのオープンウェイト版が存在することを決して許してはならないとする「安全性ショック」が増加するでしょう。これは Claude の神話に対する反応と類似しています。これにより、オープンモデルに対する負担の大きい規制が促進される可能性があります。
上記の状況に加え、主権国家や既存の権力構造が、今後登場する超強力な AI ツールをたった一社または数社の企業に独占させることはできないと認識するにつれ、オープンモデルへの長期的な関心も高まるでしょう。これらの主体は、オープンモデルを異なるガバナンスのパラダイムとして捉えるようになります。
知能へのアクセスを単一の営利企業に依存することの信頼性の低さを多くの利害関係者が認識するにつれ、オープンモデルのための新たな資金調達構造が出現します。
ローカルエージェント、OpenClaw、およびその他のパーソナルエージェントは、オープンモデル利用におけるこれまで主に無視されてきた巨大な市場を代表しています。これは一種の暗黒物質のようなものであり、オープンからクローズドへのモデルバランスに対する影響力において潜在的に広範かつ大規模な可能性を秘めています。
この投稿を支配し、意図的に繰り返されているのは「複雑(complex)」という一語です。
この複雑な現実が、なぜ私が最近のオープンウェイトモデルの能力を支持するほぼ明確な証拠があるにもかかわらず、米国のクローズド型研究所が明らかに先行すると確信できるのか、そのオープンモデル格差をどのように明確に記述するかについて、より深く考えるよう私を駆り立てています。オープンとクローズドの間の微妙な違いについては、近日公開される別の記事で詳しく触れる予定ですので、ぜひ購読してください!
私が見落としたポジションがあれば、お知らせください。
原文を表示
We’re living through the period of time when we’ll learn if open models can keep up with closed labs. The obvious answer is that no, they won’t. This answer is a form of saying they won’t keep up in every area. This framing closes off a popular prediction where the open models completely catch up, as in all models saturate and open and closed models only become increasingly similar. In living through this, it’s evidently very unclear when the longer-term stable balance of capabilities will solidify.
This is a very complex dynamic, where the core point we monitor is a capability gap between models. At the same time, this gap is intertwined with evolving dynamics in the funding of open models, who builds open models, how techniques like distillation that enable fast-following translate through new application domains, potential regulation hampering the open-source AI ecosystem, and of course who actually uses open models.
The capabilities gap is one signal in a complex sea of forces, pushing supply and demand into different shapes. In many cases the demand — where obviously tons of individuals, organizations, and sovereigns want, or need, open models — is largely separated from supply. Supply is fully dictated by economics. The question of “which business strategies support releasing open models” is still at stake.
Interconnects AI is a reader-supported publication. To receive new posts and support my work, consider becoming a subscriber.
With this complexity, I wanted to distill my key beliefs down into a clear list. These are downstream of 10+ pieces I’ve written or recorded on open models this spring (which are linked throughout).
It’s surprising that the top closed models did not show a growing capability margin over open models, based on compute differences for training and research, especially in the second half of 2025 and through today.
Open model labs are technically very strong at keeping pace on well-established benchmarks. This will continue and reflects a balance of abundant talent and sufficient computing power.
Chinese open-weight labs focus slightly more on benchmark scores than comparable closed labs in the U.S. Distillation helps the Chinese LLM companies do so, but it’s not a panacea. Changes in the distillation dynamic (e.g. regulation) will not be a determining factor on the balance of capabilities. This increase in focus is a natural evolution of their incentives in keeping the narrative on keeping up with the frontier alive, which is crucial to fundraising and adoption.
To date, closed models tend to be more robust and generally useful than similarly scoring open models. Closed models have certain hard-to-measure qualities that are not well captured in current or past benchmarks. This will be key to enabling closed models to dominate in markets where an individual user constantly presents new challenges, i.e. supporting knowledge workers as a direct assistant.
The open vs. closed model race, as monitored through benchmarks, will largely be a game of economic staying power and fast-following, until the market structure constricts. I expect Chinese open-weight labs to face funding difficulties first, as soon as later this year. Funding difficulties will be seen in different capability trajectories 3-9 months later.
The RL dominated training era has increased the relevance of distribution to real-world use-cases as a key factor in continued capabilities improvements. These are tasks where users directly use tools like Claude Code or Codex to solve problems in their job with agents. This is the first clear technical area that closed labs can dominate open-weight models on capabilities, potentially leveraging online RL directly based on user feedback.
Open models will be increasingly adopted in repetitive automation tasks, as measured in the relative share of the API market, for repetitive tasks across the ecosystem. This takes the form of many new AI-native applications, business backend automation, etc. The success of this will drive more investment in domain-specific, efficient open models.
This is a complex picture, where the long-term trajectory is more of an economics question rather than an ability one. Many other outlets can paint a far more simplistic narrative that “China will assuredly catch us in AI” and get more distribution because it is a simple story. The reality is complex. Only real AI revenue begets more investment, eventually that’ll be linked to the ability to keep improving models at a rapid rate. Economic realities have not yet impacted scaling open models, as a general category.
Share
This economic-focused angle relates to my positions on the open model ecosystem more broadly.
Recurring calls to ban certain types of open models will continue to come but are in practice impossible to implement. Training strong AI models (i.e. near but not at the frontier) is a relatively small cost compared to large-scale deployments. E.g. if the U.S. bans open models over a certain compute threshold, another sovereign entity will eventually train them and release them publicly, with the models entering the U.S. market with less oversight.
The second derivative of influence on open models has shifted, and the U.S. will slowly regain ground in adoption metrics of open models starting in early 2027 (it takes a long time for China’s velocity to slow, then flip). Examples include Google’s Gemma 4 (a wild success), Nvidia’s Nemotron, and Arcee AI.
As ever-stronger closed models are built, previewed, and released, there will be more safety-shocks saying that open-weight versions of the strongest AI models never can be allowed to exist, similar to reactions to Claude Mythos. These can spur burdensome regulation on open models.
With the above, there will also be increased long-term interest in open models, as sovereign entities and existing power structures realize the coming, super powerful AI tools cannot land in the hands of only one or a few companies. These entities will see open models as a different governance paradigm.
New funding structures for open models will emerge, as many stakeholders realize dependencies on single, for-profit companies for access to intelligence are unreliable.
Local agents, OpenClaw, and other personal agents represent a large, to date, mostly ignored market for open model usage. It is a sort of dark matter, with pervasive, massive potential for influence on the balance of open-to-closed models.
A single word governs this post and is intentionally repeated — complex.
This complex reality has been driving me to think more deeply about how to clearly describe the open model gap, and why I can hold it in my head that I expect American closed labs to clearly draw ahead, despite the fairly unequivocal evidence in support of the capabilities of recent open-weight models. More on the nuance in the open-closed gap in another piece coming soon, so please subscribe!
Let me know any positions that I missed.
関連記事
MIT の研究者が AI モデルにチャートの解釈を教示
MIT の研究者らは、市場の意思決定を加速するため、生成 AI モデルが視覚・数値・言語情報を統合してチャートを正確に解釈する技術を研究している。
オープンモデル生態系がもたらす複合効果について
主要な先端モデル構築には、最終的な大規模モデルの訓練計算よりも研究開発コストの方が多くを占める。中国のような主要プレイヤーがすべてオープンである生態系では、この構造がコスト面で有意義な優位性をもたらし、ラボがより長く開発を継続できる可能性を示唆している。
設計思想としてオープン:Ai2 が NSF OMAI の完全な AI インフラを稼働
非営利研究機関 Ai2 は、NSF(米国科学財団)の OMAI 計算リソースを活用し、再利用可能なモデルやデータを提供する完全なオープン AI 研究エコシステムを構築した。これにより、科学的発見の加速を目指す。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み