オープンモデルの次なる展開
2025年を起点としたオープンモデル戦略は、深層学習の進歩に壁がない限りクローズドモデルとの性能差が拡大し続ける中で、影響力獲得のための主要な手段として定着しつつある。
キーポイント
オープンモデル戦略の動機とコスト
MetaのLlamaのような補完財コモディティ化や、巨大なインフラ投資のコストを考慮しても、最先端のAIへの影響力維持が企業にとって重要な戦略的価値となっている。
オープンとクローズドの性能ギャップ
オープンモデルは常にトップクローズドモデルより6〜18ヶ月遅れているが、予算が少ない中でこの安定した追従は驚くべき成果であり、今後このギャップは縮まるより拡大する可能性が高い。
技術的限界と将来展望
主要なAI研究者は現在も進歩の「低い果実」が多数存在すると指摘しており、特許や秘密保持による科学的ブレークスルーがない限り、クローズドラボが定義的に変革的なツールを構築し続ける道筋にある。
オープンとクローズドの性能格差の拡大
トップラボのモデル改善速度が速く、公開ベンチマークでは測定されないような Frontier モデルへの差が開く可能性が高い。
ディストillation(蒸留)手法の限界と非公開データの優位性
複雑なRL環境やプロンプトの設計が重要になるため、クローズドモデルの性能をオープンモデルに転移させるのが難しくなり、非公開データ領域での学習優位性が固定化される。
3つのモデルクラスによる未来の定義
2026年以降は、真のクローズドFrontierモデル、オープンFrontierモデル、そしてそれらを支えるインフラや用途の分断が明確になる。
小規模オープンモデルの経済的優位性
閉じた大規模モデルよりも10倍高速で100倍安価な小規模オープンモデルは、反復的でニッチなタスクを自動化する上で経済的に viable な選択肢となる。
影響分析・編集コメントを表示
影響分析
この記事は、オープンソースAIが単なる倫理的・理想的な選択ではなく、巨額の投資対効果と競争優位性を天秤にかける現実的なビジネス戦略として位置づけられていることを示唆しています。特に、クローズドモデルとの性能差が縮まらないという前提は、オープンモデル開発者が「完全な性能追従」ではなく「エコシステムへの参入と標準化」という異なる勝利条件を追求する必要があることを示しています。
編集コメント
オープンモデルの「性能追従」から「エコシステム支配」へのパラダイムシフトを明確に指摘した重要な分析です。開発者は単なるベンチマークスコアではなく、モデルリリースによる採用とマインドシェア獲得に焦点を当てるべきでしょう。
2025 年は、多くの企業が極めて価値の高い AI エコシステムにおける影響力の道筋としてオープンモデルを真剣に受け止め始めた年でした。これは DeepSeek R1 の画期的な成功以降、下流側で劇的に加速された戦略の採用です。この取り組みの多くは、希望や原則、あるいは寛大さという使命として行われています。
オープンモデルを構築する実質的な金銭的動機を持つ企業はほとんどありません。Meta の Llama に対して自社の補完財をコモディティ化することなど、よく引用される理由は、適切に参加するためのコストが数十億ドルに達するという現実には追従しにくいものです。それでもなお、AI は技術開発の非常に初期段階にあり、主に大規模な工業化とインフラの大規模拡張によって定義されているため、AI の最前線で何らかの影響を及ぼすことは、莫大な潜在価値への道筋として見なされています。
オープンモデルはこれを達成するための非常に迅速な手段です。エンタープライズ契約やマーケティングキャンペーンなしに、優れたモデルを一つリリースするだけで、 substantial な利用と注目を集めることができます。AI 業界の多くの企業は、これよりも少ない基盤で巨額の資金を調達してきました。
オープンモデルへの過熱は、オープンモデルが実際にクローズドな研究機関を超えると願う世界を期待する「 coping(対処)」、破壊的予感、そして SF が混在した文脈によって同時に増幅されています。この目標は、AI エコシステムにとって経済的に破滅的な成功となる可能性があります。つまり利益と収益が急落する一方で、AI モデルのより広範な権力バランスと制御は長期的により安定したものになるというシナリオです。
オープンモデルが絶対的な性能で勝利する可能性は小さく、それは指導的な研究機関によって何らかの形で隠蔽された真の科学的ブレークスルーがあるか、あるいはモデルが性能面で本当に壁にぶつかった場合に限られるでしょう。どちらも確かに起こり得ますが、非常に unlikely です。
今日に至るまで進歩に壁があったことはなく、私たちがこの話題について議論するトップ AI 研究者たちは、進歩における低垂れ実(low-hanging fruit)を常に指摘していることを自覚しておくことが重要です。それが特異点への再帰的自己改善(別の記事で詳しく触れます)である必要はありませんが、大手テクノロジー企業は定義上変革的なツールを構築する直接的な道筋を進んでいます。それらはもうすぐ到来します。
シェア
オープンモデルとクローズドモデルの間の権力のバランス
オープンとクローズドの格差に対する公平な評価は、オープンモデルは常にベストなクローズドモデルより 6 ヶ月から 18 ヶ月遅れているという点です。はるかに少ない予算で運営されているオープンラボがこの状況をこれほど安定して維持できていることは、オープンラボへの驚くべき証言です。私のような多くのトップアナリストは、なぜこの格差がもっと大きくならないのかに困惑しています。蒸留(distillation)は品質面で多少役立ちますが、ベンチマークにおいてクローズドラボを上回ることは認識を高めるのに役立ちます。しかし、主要なオープンモデルの進歩はまさに驚異的です。
現実には、オープンモデルとクローズドモデルの間のギャップは縮小するよりもむしろ拡大する可能性が高いです。トップクラスのラボは以前にも増して急速に改善しており、多くの優れた新モデルをリリースし、さらにその後も続々と登場しています。公開ベンチマーク上では、オープンモデルに対するこれらの最も印象的なフロンティアモデルの改善が全く測定されていないように感じるケースも少なくありません。
コーディングエージェントの新たな時代において、クローズドモデルからのパフォーマンスを「コピー」する一般的な手法である蒸留(distillation)は、パフォーマンスを引き出すためにより創造性を要します。以前はモデルからの完全な完成文を使って学生モデルを訓練できましたが、現在では最も重要な部分は複雑な強化学習(RL)環境と、エージェントを配置するためのプロンプトです。これらは隠蔽するのがはるかに容易であり、その一方でオープンモデルをリードする中国のラボは常に計算資源の制限について不満を訴えています。
主要な AI モデルが、米国経済における複雑で高価なゲートキーパー(例:法制度や医療システム)を介して、より長期的かつ専門的なタスクへと移行するにつれて、パフォーマンスに大きな格差が生じると予想されます。コーディングは、慎重なデータプロセス、GitHub からのスクレイピング、そして巧妙な環境構築によってほぼ「解決」できる側面が大きいですが、スケールメリットとトレーニングの焦点は、パブリックウェブ上に存在しないドメインへと移りつつあります。そのため、初期の言語モデルに比べて再現ははるかに困難となっています。
今日、最先端 AI モデルを開発することは、インフラによって解き放たれた中規模から小規模の勝利を時間軸に沿って積み重ねることでより明確に定義されています。これは、品質を維持しながら範囲を広げられる組織に報奨を与えるものであり、そのコストは極めて高額です。
これらのダイナミクスすべてが組み合わさることで、オープンモデルに対するビジネス環境は解析が困難なものとなっています。2026 年まで、クローズドモデルは、オープンモデルが追随する可能性が低い方向において、飛躍的な性能向上を遂げるでしょう。これは、私たちがオープンモデルを異なる視点で考慮し、資金を提供し、利用し、議論しなければならない世界へと私たちを導きます。本稿では、オープンモデルがどのように変化しているかを解説します。それは、3 つのクラスに明確に分類される未来です。
真の(クローズド)最先端モデル。これらは最も強力な知識労働およびコーディングエージェントを駆動するでしょう。それらは、私たちが仕事との関係を見直さざるを得なくさせる、本当に画期的なツールとなるはずです。
オープン最先端モデル。これらは、上記と同じ方向で競合しようとする、最良のオープンウェイト大規模モデルとなります。ベストモデルと比較して機能しないユースケースも数多く存在するでしょうが、それらが驚くほどよく機能する無数のユースケースもあります。コーディングの一部サブセットなど、非常に価値のあるユースケースであっても、多くの場合においてこれらは素晴らしい成果を発揮します。
この規模の知能を、個人向けに電気のコストのみで提供し、アシスタント、コーチ、コンパニオンなどとして活用する意味を理解するには、AI エコシステムはまだ数年かかるでしょう。OpenClaw は、拡大・成長していく鏡の裏側の一瞥を提供しました。GPT-OSS 120B や Nvidia Nemotron 3 Super、MiniMax M2.5 周辺のモデル群は、ローカルモデルとして機能しうる性能と価格のバランスを示しています。
オープンで小規模なモデルを分散型知能として捉えること。最も成功するオープンモデルは、クローズドエージェントに対する補完ツールとなるでしょう。これは、オープンモデルが進歩の最前線を補完し加速させるための道筋です。
AI は、技術経済全体にわたる多くの反復的かつニッチなタスクを自動化するために組み込まれつつあります。私自身がオープンモデルを用いて構築しようとする企業との会話を通じて実感している通り、クローズドモデルの方が実際には依然として多くの点で優れているにもかかわらず、これらのタスクを最も優れたクローズドモデルから外すという巨大な圧力があります。その代わりに、10 倍高速で 100 倍安価に動作する小規模なオープンモデルへとシフトする必要があります。しかし、経済的に実現可能なタスクのために、可能な限り最小のモデル上でデータ構築やファインチューニングエンジンを開発している人はほとんどいません。
これらのモデルは、ほとんど脳を麻痺させるほど退屈で、かつ極めて具体的である必要があります。コーディングエージェントに支配された世界において、私は Claude Code がツールとして使いたがるようなオープンモデルを構築したいと考えています。これにより、そのサブエージェントが全く新しい業務領域を開拓できるようになります。これは可能ですが、驚くべきことに未開拓の分野です。Qwen 社などの小規模モデルは依然として汎用タスクベンチマークに基づいて販売されています。「オープンモデルがフロンティアに追いつく」という過剰な期待が、この非常に大きな需要領域から世間の目を逸らさせています。
これは、オープンモデルを単なる数個の重要な静的重み(weights)から、より生態系のようなものへと移行させるようなモデルです。これには創造性と新しいアプローチが必要です。本稿の目的は、なぜそしてどのようにこれらのモデルを構築すべきかを説明し、今日におけるオープンモデルの現状に関する追加的な文脈を提供することです。
これら 3 つのモデルクラスは、エージェントを利用する異なる方法をそれぞれ示唆しています。今後 AI がどのように構築されるかという点において、それらが単なるモデル重みではなく、思考・検索・行動を行うシステムであることが、AI の定義そのものとなることは間違いありません。重みはこれらの能力の一部のみを定義するに過ぎません。
Interconnects AI は読者支援型の出版物です。購読をご検討ください。
AI システムにおけるオープンウェイト
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等)は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
まず、言語モデルがツール群を伴わずにできる最も影響力があり、印象的なことは何かを考えてみましょう。単なる自己回帰トークンの出力に対して、あなたが驚かされたのはいつですか?数学的証明や競技用コードの作成など、相当量の作業を行わない限り、2023 年の GPT-4 のリリース以来、この状況はほとんど変わっていないように思われます。今日私たちが使用している AI システムは、重み(weights)だけよりもはるかに多くのものです。
この世界では、クローズドモデルには明確な優位性があります。クローズドモデルは、動作するチップから推論ソフトウェア、重み、ツール、ユーザーインターフェースに至るまで、すべてを垂直統合することができます。一方、オープンモデルは、さまざまな推論設定や多数のツール、そして多くのユースケースにおいてそれぞれに対応する必要があります。この垂直統合は現在、Claude Code を Opus 4.6 と共に使用したり、OpenAI の Codex を GPT 5.4 と共に使用したりする際の喜びとして最もよく表されています。オープンモデルはまだこの段階には達していません。一部では特定のインターフェースに注力し始めていますが(例:OpenCode)、オープンモデルをあなたの祝福された製品ロードマップ上でのみ動作させることには、本質的な緊張関係が存在します。
同時に、この変化は最新の AI システムがオープンであることについてより多くを示唆している可能性があります。重みだけではできることが減るなら、おそらく多くの研究所がそれらをリリースするようになるでしょう。
今日の AI システムを考える上でのアプローチは、重み(weights)、ツール、そしてハルネスの組み合わせとして捉えることです。重みの部分はすでに馴染みがあります。ツールとは、モデルがデプロイ時に動作する深く統合された環境であり、検索やコードサンドボックスがその典型例です。一方、ハルネスとは、これら 2 つをユーザーが見る製品へとどのように結びつけるかを指します。
この世界において考慮すべきことは 2 つあります:1) 今日人々が利用しているクローズドな製品に対して、同等のオープンシステムが存在するか — つまり、スタックのすべてのレベルを変更・制御できる真に同等のもの(これについては後述)— と、2) このシステムの視点がオープンエコシステムにおける将来のさまざまな意思決定にどのような影響を与えるかです。
まだオープンモデルのビジネス戦略を探求中
オープンモデルのビジネスと実用性がどのように進化していくかを理解するために、現代のテクノロジー企業におけるオープンソースの役割に関する基礎的な文献を時系列で振り返ってみましょう。まず挙げられるのは Google のブログ記事「The Meaning of Open」です。これはもともとジョナサン・ローゼンバーグによる社内メモであり、後に公開されるに至るまで激しい内部議論を引き起こしたものです。まずは、オープンシステムがどのように機能しうるかについての基本的な評価から始めましょう:
オープンシステムは産業を創出する可能性を秘めています。それは一般大衆の知恵を活用し、企業が自社のビジネス戦術の巧妙さだけでなく、製品そのものの優位性に基づいて競争し、革新し、勝利することを促します。
私は長年、オープンモデルの生態系から最も恩恵を受けるのは、その生態系を最も深く理解している企業だと信じてきました。これには、モデルの利用方法におけるオープンな研究や実験に深く関与することが含まれます。これまでのところ、多くのオープンモデル企業のビジネスモデルはそうではありません。ローゼンバーグは 2009 年の投稿で、この点をさらに展開し、オープンシステムとクローズド製品のダイナミクスを比較しています:
[オープンシステム] は競争が激しく、はるかに動的です。オープンシステムにおいて、競争優位性は顧客をロックインすることから生まれるのではなく、誰よりも速く変化するシステムを理解し、その知識を用いてより良く、より革新的な製品を生み出すことから生まれます。オープンシステムで成功する企業は、迅速なイノベーターであると同時に思想のリーダーでもあります。思想のリーダーシップというブランド価値が顧客を引きつけ、そして迅速なイノベーションが顧客を維持します。これは容易なことではありません——むしろその逆ですが、速い企業には恐れるべきものはなく、成功すれば大きな株主価値を生み出すことができます。
オープンウェイトモデルだけでは製品として成立しないことは、すでに時を経て知られています。モデルはツールやハーンセス(harnesses)を備えているという意味で製品ではありますが、私たちは実際には完全なオープンシステムを持っていません。むしろ、部分的にオープンで部分的にクローズドなシステムを持っており、その結果、参入障壁が曖昧になっています。VLLM や GLM 5 のようなモデルはシステムの構成要素ですが、それらをデプロイするにはさらに多くのものが必要です——高価なプライベート GPU と、ローカルビジネスデータを用いたいくつかのツールです。
AI が、過去の技術世代に対する類似のオープンシステムを持つには複雑すぎ、コストが高すぎる結果になるかもしれません。もし完全なオープンシステムが存在すれば、多くの歴史的な技術世代が示してきたように、デフォルトで勝利するでしょう。この完全なオープンなアナログはまだ存在しないため、オープンソース AI の役割について絶え間ない議論が続いています。
ビル・ガーリーは、Google の無料製品が技術全体にわたるオープンまたはフリーの戦略をどのように体現しているかを回顧しています。ガーリーは 2011 年、オープンソースオペレーティングシステムである Android と、無料ブラウザである Chrome について以下のように記述しました。
ここで肝心な点は、Android はもちろんのこと、Chrome や Chrome OS も、古典的なビジネスの文脈における「製品」ではないということです。それらには、自分たちで独自の「経済的城塞」となる計画はありません。むしろ、Google の城の高さと規模によって資金提供される、非常に高価かつ非常に攻撃的な「堀(モート)」なのです。Google の目的は攻勢ではなく防衛です。Android や Chrome で利益を得ようとしているわけではありません。彼らは、自分たちと消費者の間に存在するあらゆる層を無料化し、あるいはそれ以下にするつもりです。
これらの層は基本的に可変コストのないソフトウェア製品であるため、これは非常に実現可能な防衛戦略となります。本質的に、彼らは単に堀を築いているだけでなく、Google は城の外側 250 マイル(約 400 キロ)の範囲を焼き払うことで、誰も近づけないようにしているのです。
同じ投稿の中で、ガーリーは Google のオープン性の限界についても振り返っています。
このオープンマニフェストにおいて、ジョナサンは繰り返し、オープンシステムはエンドユーザーにとって疑う余地なく最良のソリューションをもたらすと述べています。ただし、一つの例外があります。「多くの場合、特に検索や広告製品においては、コードを公開してもこれらの目標に貢献せず、むしろユーザーに悪影響を与えるでしょう」と。ロドニー・ダンファースが映画『キャディッシュャック』で言ったように、「しかし、あなたには似合っていますね」。
本質的に、Google はあまりにも多くのものをオープンソース化しました。実際には、その製品を使用する人々(例えば、Android を使用する携帯電話メーカー)に支払いを行うことで、検索という収益の中心へとつながる漏斗を維持しようとしてきました。これが、検索ビジネスが今日に至るまで資金を提供し続けている善循環です。
AI はまだこれとは全く異なりますが、変化の兆候は現れ始めています。これらの企業におけるモデルの価値に対するデフォルトの信念は、「モデルこそが製品である」というものです。これは、ホスト型 API のような製品において明白であり、モデルの重みを公開することはビジネス上の自殺行為となるでしょう。しかし、Claude Code、Codex、Cursor などのインターフェースが大幅に普及するにつれて、この考え方は軟化しつつあります。少なくともスタックの一部においては、よりオープンな道筋となり得る可能性があります。これは、Moonshot や Z.ai が提供するコーディングプランで見ることができます。モデルはオープンであるにもかかわらず、ビジネス側での需要は非常に高いです。多くの人は、自分でモデルの使い方を工夫するのではなく、推論機能付きの安価なインターフェースを利用します(企業が主に消費者向けまたは一人あたりのサービスである限り)。
これらのことは、今後数年間で企業がよりオープンになる方向性について私を楽観させるものではありません。むしろ逆の展開になると予想します。Nvidia にはオープンであるべき一つの大きな理由があります——オープンモデル上で構築する人々に GPU をより多く販売し、彼らが次に何を構築するために必要としているかを理解するためです。しかし、このリストにおいて他に明白な理由は誰もいません。オープンモデルを構築するためのより具体的な経済的理由が生まれるまで、最前線でこれらのモデルを構築している企業は、モデルに費やすリソースが減少し、最も優れた少数の企業への統合(コンソリデーション)に直面することになるでしょう。
オープンな最前線における統合が進む中で、モデルへの投資は、ベストなクローズドな最前線モデルと比較してモデルがより差別化された upside を発揮できる分野へとシフトすべきです。
コメントを残す
特化型で、安価で、高速かつ至る所に存在するオープンモデル
オープンモデルを構築する一流企業に焦点を当てて最前線で競争しようとするあまり、過度な執着が見られます。実際には、システム内で反復利用されるケースに対して安価で信頼性の高いモデルを求める企業の市場が、圧倒的に未開拓です。想像してみてください。内部のスキルに特化させる一連の LoRA アダプター(Low-Rank Adaptation)を備えた小さなモデル一つ。これは、エージェントをオーケストレーションする最前線のクローズドモデルに対するツールおよび補完として、非常に安価にデプロイすることができます。
フロンティア・エージェントモデルが数十回から数百回行うすべてのタスクは、潜在的に小規模なモデルへアウトソースできる可能性があります。これにはローカルモデルがファイルを読み取って要約し、それを Claude へ送信する際のプライバシー保護といった付随的な利点もありますが、この方向へ強く推進している人はほとんどいません。現時点で能力がありカスタマイズ可能な小規模モデルの主要なファミリーは Qwen ですが、キーパーソンの離脱により現在は不透明な状況にあります。Gemma、Phi、Olmo などはすべて品質と改変の可能性において大幅に低下しており、大きな一歩後退です。
これをスケールアップできる理由は明白な例がいくつかあります。最近の議論では、新しい Qwen 3.5 4B モデルがオリジナルの ChatGPT モデルを凌駕する可能性があると指摘されました。研究側面では、特定のコードベースに対してオープンモデルをファインチューニングし、はるかに大規模なモデルと同等のパフォーマンスを発揮させるためのレシピも既に存在します。Moondream.ai は私の友人 Vik が設立したスタートアップで、極めて限られた予算の中で世界最高クラスの小規模マルチモーダルモデルのいくつかを開発しています — 彼らは Qwen や Llama と実世界のタスクにおいて競合しています。これは氷山の一角に過ぎません。
インテリジェンス圧縮については、最も優れた数モデルの進捗を追跡することほど興奮を呼ばないため、ほぼ同等の深さ(または資源)で探求されていません。これらの領域を探求することは、標準的な技術拡散プロセスであり、これは緩やかであるため、人々が AI をどのように構築するかを理解する上でまだ初期段階にある理由です。私の主張は、オープンモデルを構築している人の多くが、自らの競争力に関する認識においてわずかに誤解しているということです。最も優れた数モデルは汎用能力において勝利し、他の場所には依然として多くの未開拓のニッチが存在します。
これを次のレベルに引き上げるには、この作品の冒頭で示唆したように、1〜3 のタスクにおいて真に卓越するように範囲を限定されたオープンモデルをリリースすることです。あまりにも多くの人々が Qwen と競争し、自分の小規模モデルが最先端 AI ベンチマークで素晴らしい成果を収めていることを示そうとします。ここで適切なベンチマークは、計算資源と時間の節約です。
この移行が徐々に現実となるには数年かかるでしょう。私がこれに非常に興奮している理由の一部は、これがオープンモデルにおけるイノベーションを、「一つのモデルがすべてを支配する」という最先端モデルが前提とする標準的なものから、多様性、専門化、そして好奇心に基づくものへと駆動しているからです。
共有
モデル vs. エコシステム。
統合 vs. 創造。
AI のオープンソースエコシステムが、クローズドな研究所を追いかけるモデルプロバイダーの集まりによって定義される限り、それは主に敗北します。資金調達と実質的な採用において苦境に立たされ、クローズド AI 企業に生じる統合と同様のものが、オープンモデル構築者にも訪れるでしょう——おそらくさらに早くです。
オープンシステムは、その最良の状態で、多くの人々が参加し、多くのアプローチが花開くことを可能にします。
オープンモデルの世界は、よりエコシステムであるべきです。私は過去に、中国が多様な企業を有していることでこの種の環境により近いと述べてきましたが、アプローチにおける多様性は依然として低すぎます。
エコシステムは自己強化しますが、個々のモデルは時間の中で静的な産物です。エコシステムは、次なるものに対する明確で絶え間ない機会を示し、価値提案が成長します。
オープンモデルの進むべき道は、フロンティア研究所とは異なる問題を解決し、オープンモデルが効果的な無料の代替手段となる場所を見つけ、クローズドな研究所では提供できない専門モデルの使用法を示すことです。強力な AI システムの構築が高額になり、今日の貴重なクローズド研究所の多くを価格から排除する前に、オープンモデルの世界は創造性を受け入れる必要があります。
原文を表示
2025 was the year where a lot of companies started to take open models seriously as a path to influence in the extremely valuable AI ecosystem — the adoption of a strategy that was massively accelerated downstream of DeepSeek R1’s breakout success. Most of this is being done as a mission of hope, principle, or generosity.
Very few businesses have a real monetary reason to build open models. Well-cited reasons, such as commoditizing one’s complements for Meta’s Llama, are hard to follow up on when the cost of participating well is billions of dollars. Still, AI is in such an early phase of technological development, mostly defined by large-scale industrialization and massive scale-out of infrastructure, that having any sort of influence at the cutting edge of AI is seen as a path to immense potential value.
Open models are a very fast way to achieve this, you can obtain substantial usage and mindshare with no enterprise agreements or marketing campaigns — just releasing one good model. Many companies in AI have raised a ton of money built on less.
The hype of open models is simultaneously amplified by the mix of cope, disruptive anticipation, and science fiction that hopes for the world where open models do truly surpass the closed labs. This goal could be an economically catastrophic success for the AI ecosystem, where profits and revenue plummet but the broader balance of power and control of AI models is long-term more stable.
There’s a small chance open models win in absolute performance, but it would only be on the back of either a true scientific breakthrough that is somehow kept hidden from the leading labs or the models truly hitting a wall in performance. Both of them are definitely possible, but very unlikely.
It is important to remind yourself that there have been no walls in progress to date and all the top AI researchers we discuss this with constantly explain the low-hanging fruit they see on progress. It may not be recursive self-improvement to the singularity (more on that in a separate post), but large technology companies are on a direct path to building definitionally transformative tools. They are coming.
Share
The balance of power in open vs. closed models
The fair assessment of the open-closed gap is that open models have always been 6-18 months behind the best closed models. It is a remarkable testament to the open labs, operating on far smaller budgets, that this has stayed so stable. Many top analysts like myself are bewildered by the way the gap isn’t bigger. Distillation helps a bit in quality, benchmaxing more than closed labs helps perceptions, but the progress of the leading open models is flat out remarkable.
The reality is that the open-closed model gap is more likely to grow than shrink. The top few labs are improving as fast as ever, releasing many great new models, with more on the docket. Many of the most impressive frontier model improvements relative to their open counterparts feel totally unmeasured on public benchmarks.
In a new era of coding agents, the popular method to “copy” performance from closed models, distillation, requires more creativity to extract performance — previously, you could use the entire completion from the model to train your student, but now the most important part is the complex RL environments and the prompts to place your agents in them. These are much easier to hide and all the while the Chinese labs leading in open models are always complaining about computational restrictions.
As the leading AI models move into longer-horizon and more specialized tasks, mediated by complex and expensive gate-keepers in the U.S. economy (e.g. legal or healthcare systems), I expect large gaps in performance to appear. Coding can largely be mostly “solved” with careful data processes, scraping GitHub, and clever environments. The economies of scale and foci of training are moving into domains that are not on the public web, so they are far harder to replicate than early language models.
Developing frontier AI models today is more defined by stacking medium to small wins, unlocked by infrastructure, across time. This rewards organizations that can expand scope while maintaining quality, which is extremely expensive.
All of these dynamics together create a business landscape for open models that is hard to parse. Through 2026, closed models are going to take leaps and bounds in performance in directions that it is unlikely for open models to follow. This sets us up for a world where we need to consider, fund, use, and discuss open models differently. This piece lays out how open models are changing. It is a future that’ll be clearly defined by three classes of models.
True (closed) frontier models. These will drive the strongest knowledge work and coding agents. They will be truly remarkable tools that force us to reconsider our relationship to work.
Open frontier models. These will be the best open-weight, large models that are attempting to compete on the same directions as above. There will be plenty of use-cases that they don’t work for relative to the best models, but countless use-cases where they work remarkably well. For many use-cases, even ones as valuable as some subsets of coding, these will work great.
The AI ecosystem will still take years to understand what it means to have intelligence of this magnitude served in private, at the marginal cost of electricity for individuals, as assistants, coaches, companions, and more. OpenClaw provided a glimpse behind the mirror that will expand and grow. The class of models around GPT-OSS 120B, Nvidia Nemotron 3 Super, or MiniMax M2.5 are the balance of performance to price that can work as local models.
Open, small models as distributed intelligence. The most successful open models will be complementary tools to closed agents. This is a path for open models to complement and accelerate the frontier of progress.
AI is slotting in to automate many repetitive, niche tasks across the technology economy. There’s a huge pressure to shift these tasks off of the best closed models — which frankly are still better at most of the things, across my conversations with businesses trying to build with open models — to small, open models that can be 10X faster and 100X cheaper. There aren’t really people building data and fine-tuning engines for economically viable tasks on the smallest models possible.
These models need to be almost brain-numbingly boring and specific. In a world dominated by coding agents, I want to build open models that Claude Code is desperate to use as a tool, letting its sub agents unlock entirely new areas of work. This is possible, but remarkably under-explored. Small models from the likes of Qwen and co. are still marketed on general-task benchmarks. The hype of “open models catching the frontier” distracts the world from this very large area of demand.
This is the sort of model that moves open models from just a few, crucial static weights to more of an ecosystem. It requires creativity and a new approach. The goal of this piece is to illustrate why and how to build these, with added context on where open models stand today.
All three of these model classes hint at different ways to use agents. It is absolutely definitional to how AI is going to be built going forward that they’re not just model weights, but rather systems that think, search, and act. The weights only define one portion of those abilities.
Interconnects AI is a reader-supported publication. Consider becoming a subscriber.
Open weights as part of an AI system
To start, consider what are the most impactful and impressive things that language models can do without a suite of tools at their side. When was the last time that you were blown away by something that was just autoregressive token outputs? Unless you’re doing a substantial amount of work on mathematical proofs or competition code, it seems like that situation has changed little since GPT-4’s release in 2023. The AI systems we use today are about far, far more than weights.
In this world, closed models have a clear advantage. Closed models get to vertically integrate everything from the chips they run on, the inference software, the weights, the tools, and the user interface. Open models on the other hand need to work on every inference setup, with many tools, and in many use-cases. This vertical integration is best expressed today in the joy of using Claude Code with Opus 4.6 or OpenAI’s Codex with GPT 5.4. Open models haven’t passed this point. Some are starting to focus on specific interfaces, e.g. OpenCode, but there’s an inherent tension in making an open model work only in your blessed product roadmap.
At the same time, this change could point to more about the latest AI systems being open! If you can do less with the weights alone, maybe more labs will release them.
The way to think about AI systems today is as a mix of weights, tools, and harnesses. The weights portion is familiar. The tools are the deeply integrated environments the models act in at deployment time — best typified by search and code sandboxes — and the harness is how these two fit together with a product that the user sees.
In this world, there are two things to consider: 1) Is there an equivalent, open system to the closed products that people are using today — I mean truly equivalent, where every level of the stack can be modified and controlled (more on this later), and 2) How does this system’s view impact different future decisions in the open ecosystem?
Still looking for open model business strategies
To understand how the business and practicality of open models will evolve, let me take a tour back in time to foundational writing on the role of open-source in modern technology companies. The first is a Google blog post, The Meaning of Open, which originally was an internal memo by Jonathan Rosenberg, which sparked an intense internal debate that later resulted in it becoming public. To start, here’s a basic assessment of how open systems can work:
Open systems have the potential to spawn industries. They harness the intellect of the general population and spur businesses to compete, innovate, and win based on the merits of their products and not just the brilliance of their business tactics.
I’ve long believed that the company who will benefit most from the ecosystem of open models is the one who understands it best. This entails being deeply involved with open research and experimentation in how to use the models. So far, most of the open model company business models are not this. Rosenberg expands on this in his 2009 post, comparing the dynamics of open systems to closed products:
[Open systems] are competitive and far more dynamic. In an open system, a competitive advantage doesn’t derive from locking in customers, but rather from understanding the fast-moving system better than anyone else and using that knowledge to generate better, more innovative products. The successful company in an open system is both a fast innovator and a thought leader; the brand value of thought leadership attracts customers and then fast innovation keeps them. This isn’t easy — far from it — but fast companies have nothing to fear, and when they are successful they can generate great shareholder value.
We’ve known for some time that open weight models are not actually enough to constitute a product — models are a product in the sense that they have tools and harnesses, so we don’t actually have fully open systems, we have systems that are partially open partially closed, making moats messy. VLLM and a model like GLM 5 are pieces of a system, but it still takes more to deploy them — expensive private GPUs and some tools with local business data.
It may turn out to be that AI is too complex and expensive to have any analogous open system to previous generations of technology. If there was a fully open system, it would win by default, as many historical generations of technology have shown us. This fully open analog does not yet exist, so we have constant debates on the role of open-source AI.
Bill Gurley recounts how Google’s free products have exemplified the open or free strategies across technology. Gurley wrote on the open-source operating system, Android, and the free browser, Chrome, in 2011:
So here is the kicker. Android, as well as Chrome and Chrome OS for that matter, are not “products” in the classic business sense. They have no plan to become their own “economic castles.” Rather they are very expensive and very aggressive “moats,” funded by the height and magnitude of Google’s castle. Google’s aim is defensive not offensive. They are not trying to make a profit on Android or Chrome. They want to take any layer that lives between themselves and the consumer and make it free (or even less than free).
Because these layers are basically software products with no variable costs, this is a very viable defensive strategy. In essence, they are not just building a moat; Google is also scorching the earth for 250 miles around the outside of the castle to ensure no one can approach it.
In the same post, Gurley reflects on the limits of Google’s openness:
In this open manifesto, Jonathan opines over and over again that open systems unquestionably result in the very best solutions for end customers. That is with one exception. “In many cases, most notably our search and ads products, opening up the code would not contribute to these goals and would actually hurt users.” As Rodney Dangerfield said in Caddyshack, “It looks good on you, though.”
Essentially, Google open-sourced so much, in fact paid people to use its products (e.g. paying phone makers to use android) to keep the funnel leading to the search profit center. This is the virtuous loop that the search business still funds to this day.
AI is still nothing like this, but signs of change are emerging. The default belief on the value of models to these companies is that the model is the product. This is obvious with products like hosted APIs, where releasing the model weights would be business suicide, but this is softening as interfaces like Claude Code, Codex, Cursor, etc. get vastly popular. It could be a path to more openness, at least in parts of the stack. We can see this with the coding plans offered by Moonshot and Z.ai — where the demand is very high for the businesses, even though the model is open. Most people will just use the cheap interface with inference, instead of figuring out how to use the model themselves (as long as the business is mostly consumer or per-head services).
All of this doesn’t leave me optimistic on the direction of companies becoming more open in the coming years. I’d expect the opposite still. Nvidia has the one great reason to be open — to sell more GPUs to people building on open models and understand what they need to build next, but there’s no one else obvious on this list. Until there are more specific economic reasons to build open models, the companies building these at the frontier will have fewer resources to spend on the models and face a consolidation to the best few.
In the face of consolidation at the open frontier, the investment in the models should shift to areas where the models can have more differentiated upside relative to the best closed frontier models.
Leave a comment
Open models that are specific, cheap, fast, and ubiquitous
There’s too much obsession with the best companies building open models to try and compete at the frontier. There’s a vastly underserved market of enterprises that want cheap, reliable models for repetitive use-cases in their systems. Picture this, one small model with a series of LoRA adapters that specialize the model to internal skills. This can be deployed very cheaply as tools and a complement to the frontier closed models that are orchestrating agents.
Every task that a frontier agentic model does tens to hundreds of times can potentially be outsourced to a small model. There are ancillary benefits to this, e.g. privacy of a local model reading your files and summarizing to Claude, but almost no one is pushing hard in this direction. The leading model family of capable, customizable small models to date is Qwen, but that’s now shrouded in uncertainty with the departures of key personnel. Gemma, Phi, Olmo, etc. are all major steps down in quality, and therefore potential for modification.
There are a few obvious examples why this can be scaled up. There was a recent thread and discussion on how the new Qwen 3.5 4B model arguably bests the original ChatGPT model. On the research side, there are already recipes for finetuning open models on specific code-bases to match performance of much bigger models. Moondream.ai is a startup made by a friend of mine Vik, who builds some of the best, small multimodal models on a tiny budget — they compete with Qwen and Llama on real world tasks. This is the tip of an iceberg.
Intelligence compression hasn’t been explored with nearly as much depth (or resources) because it is less exciting than keeping track of the progress of the best few models. Investigating these areas is the standard technological diffusion process that is slow and why we’re still early in understanding how people will build with AI. My contention is that too many people building open models are slightly deluded in their perception of their competitiveness. The best few models will win on general capabilities and there are still plenty of underserved niches elsewhere.
Taking this to the next level involves releasing open models that are scoped to be truly excellent at 1-3 tasks, as I hinted at the beginning of this piece. Too many people try to compete with Qwen and show that their small model does great on frontier AI benchmarks. The right benchmark here is savings in compute and time.
It’ll take years for this transition to slowly become reality. Part of why I am so excited about it is that it is driving innovation on open models being more about diversity, specialization, and curiosity, rather than the standard “one model to rule them all” that the frontier models presume.
Share
Models vs. ecosystems.
Consolidation vs. creativity.
So long as the open source ecosystem for AI is defined by a bunch of model providers trying to chase after the closed labs, it will largely lose. It will face pain on funding and substantive adoption. The same consolidation that will come for closed AI companies will come for open model builders — likely even sooner.
Open systems at their best allow many people to participate and many approaches to flourish.
The world of open models needs to be more of an ecosystem. I’ve discussed in the past how China is closer to this type of environment by having a variety of companies, but the variety in approaches is still too low.
Ecosystems are self-reinforcing, whereas individual models are static artifacts in time. Ecosystems showcase clear, constant opportunities for what’s next that have growing value propositions.
The path forward for open models is to solve different problems than the frontier labs, to find places where open models are effectively free alternatives, to show ways of using specialized models that the closed labs cannot offer. The world of open models needs to embrace creativity, before building powerful AI systems grows too expensive and prices out many of the prized open labs of today.
関連記事
Granite 4.1 3B SVG ペリカンギャラリー
IBM は数日前に Apache 2.0 ライセンスの LLM「Granite 4.1」ファミリー(3B、8B、30B)を公開した。本記事は同モデルの学習プロセスや、SVG ペリカンのギャラリーを紹介している。
最新オープンアーティファクト(第20号):新組織、新モデルタイプ!Nemotron Super、Sarvam、Cohere Transcribeなど
本記事は、QwenやDeepSeekなどの大規模モデルに偏らない多様なオープンソースモデルを紹介する。OCR、RAG検索、音声文字起こし、コード編集など多様な用途とモーダリティに対応するモデルが網羅されており、開発者にとって参考となる。
このスタートアップは、エンタープライズソフトウェアをプロンプトのように見せたいと考えている
同社は、エンタープライズ向けAIオペレーティングシステムを構築するために1200万ドルのシード資金を調達した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み