今日の最先端 AI 企業は、もはや AI の能力フロンティアを超えることはない(18 分読)
TLDR AI は、現在の最先端 AI 企業が将来的に能力フロンティアをさらに上回ることはないと主張し、技術的限界と経済的・物理的制約が成長のボトルネックとなっている点を指摘している。
キーポイント
技術的・物理的限界への到達
計算資源の増加やデータ量の拡大だけでは、現在のアーキテクチャで知能を飛躍的に高めることは物理的に不可能であり、フロンティアに達したと示唆されている。
経済的インセンティブの欠如
さらに高い性能を出すための追加投資に対するリターンが減少しており、企業にとって過剰な研究開発への資金投入が非合理的であると分析している。
パラダイムシフトの必要性
現在の延長線上での進化は限界に達しており、真の飛躍には根本的に異なるアプローチやアーキテクチャの革新が必要不可欠である。
影響分析・編集コメントを表示
影響分析
この分析は、AI業界が「無限の成長」から「成熟と最適化」フェーズへ移行する可能性を示唆しており、投資家や企業の戦略に大きな影響を与える。特に、現在の LLM ベースのアプローチに対する懐疑論を強め、次世代アーキテクチャへの研究資金配分や、規制・倫理面での議論の重要性を再認識させる契機となる。
編集コメント
これは楽観的な成長予測に対する警鐘であり、業界全体が直面する構造的な課題を浮き彫りにした重要な論考です。
AI について話した人たちは皆、AI の未来は少数のプレイヤーによって支配されるより大きなモデルにあると常に考えていました。その気持ちもわかります…彼らは過去10年間にわたる非常に強い傾向を目に焼き付け、その見解をあらゆる AI 規制、投資家戦略、ベンチャーキャピタルのピッチデッキ、未来予測に持ち込んでいます。
しかし、彼らは全く間違っています。今や数字がそれを証明しています。小規模な AI モデルからなるネットワークは、*すべてのフロンティア AI システム(Fable/Mythos を含む)において速度、精度、コストのすべてで上回っています*。
IBM、米国政府、ベル・テレフォン、*ベル研究所*、そして他の誰もが 1960 年代にメインフレームコンピュータについて間違っていました…そして今日も中央集権型 AI について皆が間違っています。未来は*ニューラルネットワークのネットワーク*です。それは AI における PC+インターネットです。未来はオープンソースかクローズドソースかの AI ではありません…それはネットワークソース AIです。
「AI ラス」が AI の能力/速度を最大化し、コストを最小化するための競争だとしたら…そして AI ユーザーが根本的に可能な限り最大の能力を求めるか、あるいは最低価格(コスト)で最良の取引(能力+速度)を選ぶかのどちらかであるなら、中央集権型 AI への競争はすでに終わっており、分散型 AI が明確に勝利しています。その理由を理解するには、一つずつ見ていきましょう。
ニューラルネットワークのネットワークは現在、あらゆるフロンティア AI システムよりも高速、低コスト、かつ高性能です。ゲームは終了しました。私は個人的にこれを検証済みであり、インターネット上の複数の分野でもその結果が裏付けられています。こちらが今日発表された事例です:
これは単に最良のモデルよりも高い精度を出す方法を示しているだけでなく、半額の価格で最良のモデルを凌駕しています。私はこの同じ手法を 6 ヶ月前から実際に使用しています。当時、人類最後の試験の多肢選択問題におけるフロンティア AI モデルのスコアは以下の通りでした。
そして…これらを差分プライバシー(differentially private)を組み合わせた組み合わせが50 点台後半に到達しました!
こちらではスタンフォード大学の学生がこの手法を実践し、スタートアップを立ち上げています。
結論として… 世界で最も高性能な AI システムを今日から入手したいのであれば、それは弱めの AI モデルをルーティング/加重したアンサンブル(ensemble)からのみ可能です。スケーリング法則やアンサンブルの仕組みにより、単一のフロンティア AI システムが今後再び能力の限界に達することは決してありません(詳細は後述)。
オープンソースモデルは、単に高速です。その理由の一部は、それらをホストする人々が「極めて速く安価な結果を提供することでしかお金を稼いでいない」からです。私の言うことを信じられないですか?OpenRouter には独立した評価があります(注:これはこれらの企業の営業担当者が行う企業向けの売り込みとは異なります… これは実際に現場で起こっていることです)。
オープンソースモデルは、推論コストのみで提供されます(トレーニングは無料で提供されるため)。業界全体で見れば、同じ知能レベルであれば、重さあたりのコストも低くなります。しかし以前には、「最高レベルの知能を達成するには集中型 AI しか選択肢がなかった」というギャップが存在しました。
しかし今、このチャートは書き換えられつつあります… なぜなら、異なる種類の分散型 AI が台頭しているからです。執筆時点では、Fable/Mythos レベルのパフォーマンスを得るための最安の方法は、もう FABLE/MYTHOS ではありません。実際には、GPT と Opus のあらゆる組み合わせ(Opus を自身と組み合わせたものさえも!)が該当します。
そして、このチャートから彼らが省略しているのがこれです… もしさらに多くのモデルを追加すれば、能力値はさらに上昇し続けるでしょう(私は 6 ヶ月前にこれらの実験を自ら行ったため知っています)。例えば、上記のリストについて疑問を抱くかもしれません。なぜならそこには主にクローズドソースモデルが掲載されているからです。しかし、最新の Kimi モデルが本日ついにリリースされました。これは間違いなく Opus や GPT-5.5 と組み合わせて Fable レベルのパフォーマンスを発揮しつつ、さらに安価になるでしょう。なぜ私がこれを知っているのか?それは「Kimi K2.7 が OpenRouter でアンサンブルされているどのモデルよりも優れている(Fable 自体を除く)」からです。
戦略は、あらゆるフロンティア AI モデルを取得し、次に最適な(より安価な)フロンティア AI モデルを見つけ、それを主要なオープンソースモデルとアンサンブル化することです。そうすれば、フロンティアのより安価なバージョンが完成します。そしてこれが再帰的に繰り返されます。アンサンブル規模が大きくなり、ルーターが改善され、精度が向上し、コストはさらに低下します。
いわゆる「フロンティア AI 企業」が再び精度・コスト・速度におけるフロンティアを達成することは二度とありません。フロンティアは今や主要なモデルと企業のネットワークによって所有されています。
今日の集中型 AI 企業が抱える問題は、20 世紀後半のメインフレームコンピューティング企業が抱えていた問題と同じです。インターネットが電話回線を通じてメインフレームコンピュータ同士を結び始めた瞬間から…メインフレームコンピュータのネットワークは、いかなる単一のメインフレームよりも常に強力でした。
これはつまり…彼らがインターネットに対抗するために*より強力なメインフレームを追加するたびに*、インターネットはそのメインフレームを自らのネットワークに吸収し、さらに強くなることを意味します。お気に入りのベンチャーキャピタリスト、ポッドキャスト出演者、あるいはフロンティアのマーケティング部門は同意しないかもしれませんが、今や単一の企業が AI のフロンティアを独占することは不可能です。船は出航しました。ゲームは終了しました。
ニューラルネットワークのネットワークへようこそ。
なぜこの競争優位性がこれほど頑健なのか?率直に言って、それは機械学習(ML)において極めて基本的な原則に基づいているため、もはや研究と呼ぶには及ばないのです。
ここが重要な点です… AI 研究の世界に長く身を置いている人々は、2010 年から 2020 年頃の NeurIPS(Neural Information Processing Systems)で「最先端」の精度を競い合うのがどんなものだったかを覚えています。もしあなたが「SOTA(State of the Art:最先端技術)」を達成すれば、論文が掲載され… おそらくトップレベルの大学院への進学も叶うでしょう。(私は学部生時代に SOTA を達成し、ICML 2015 で第 1 著者として口頭発表を行う機会を得ました。その結果、ナッシュビルという地方の大学出身の私が、DeepMind の資金提供を受けてオックスフォード大学へ行き、2017 年に DeepMind の言語モデル研究チームに参加することになりました。)SOTA を競うことは非常に大きな意味を持ちました。誰もがそれを行っていました(今でも多くの人々が続けています)。
しかし、SOTA を達成するための方法として、*あまりにも信頼性が高く* 禁止されていた手法がありました。それは*複数のモデルを重み付きアンサンブル(ensemble models:複数のモデルの出力を組み合わせて精度を高める手法)で結合する*ことです。これを行えば、ほぼ確実に精度が向上します… 同じモデルの訓練済みバージョンを複数組み合わせた場合でも!(!!)
その理由は実は非常にシンプルです… 異なる AI モデルはそれぞれ異なるミスを犯します。それらの出力を組み合わせると… それらのミスはお互いに相殺され… より正確な AI の予測結果をもたらすのです。これをうまく行うにはいくつかの微妙な点(アンサンブルの重み付けなど)が必要ですが、この手法は機能します。
面白いことに… 研究会議で禁止されていたため、*研究論文でもこの手法は禁止されていました*。そのため、私は思います… 多くの人がそれを忘れてしまったのでしょう。笑。とにかく… だから*ニューラルネットワークのネットワーク(network of neural networks:複数のニューラルネットワークを組み合わせる構造)*は、いかなる単一のニューラルネットワークよりも常に優位性を保つのです。
しかしあなたは尋ねるかもしれません… コストはどうなるのでしょうか?
巨大なニューロンの束について言えることは、現在の形では信じられないほど非効率的だということです。そのため、この非効率性を攻撃することで、AI のコストは年間 10-900 倍に削減されています [1]。これには多くの要因が関わっていますが、私はアルゴリズム的な側面、具体的にはキャッシングとインデックス化に焦点を当てたいと思います。
図書館に行き、司書に「チェスのルールは何ですか?」と尋ねたと想像してください。すると司書は「少々お待ちください」と言い、図書館にあるすべての本のすべてのページを読み始め、そして戻ってきて…🥁…1 つのトークンを返すのです。
これが GPT-3 の行っていたことです。ほぼすべてのニューロンを使ってすべてのトークンを生成しました…そして覚えておいてほしいのは、世界の知識すべてがニューロンの中にあるということです!
「DeepSeek」の瞬間はシンプルなアイデアでした。「図書館にセクションがあったらどうだろう?」と。そうすれば司書は「チェスセクション」へ歩き出し、より速く結果を届けることができます。
これは AI が向かっている理想的な状態を示しています…それはエキスパートの混合(Mixture of Experts)ではなく、エキスパートの混合の混合です。インデックス化こそが鍵です!司書がどのように行うかを考えてみてください。「チェスのルールは何ですか?」と尋ねたとき、彼らは次のようにします:
- セクション:ゲームセクションへ移動
- シェルフ:チェス関連の書籍が並んだ棚を探す
- 本:背表紙をスキャンし、「Introductory Chess Book」やそれに類するタイトルを探す
- 章:目次をスキャンし、「ルール概説」を探る
- 段落:チェスのルールに関する高レベルな概要を提供する段落を見つけ、その段落があなたのもとへ戻り、手渡される。
そしてこれは、トークンを生成するたびに棚にあるすべての本、すべてのページを読み込むよりも、数十億倍も効率的(つまりコストがはるかに低い!)です。
AI も同じことをしています… 同じ理由で… 最速かつ最低コストの選択肢は、宇宙のあらゆる事実を考慮する単一の巨大なネットワークではなく、世界のニューロンに対する大規模なインデックスになります。そして、神経ネットワークのグローバルネットワークこそが、史上最大規模のキャッシュ+インデックスです。ネットワーク上の各モデルは、内部メンタルモデル(ニューロンに保存されている)の「キャッシュ」です。それらを見つける方法はルーター… 巨大なインデックスです。だからこそ、これが勝つのです。これについては後ほど詳しく説明します。
コストに関する根本的な議論は、速度に関する根本的な議論と同じですが、一つの疑問にお答えしましょう:複数の AI モデルを組み合わせることは、単一の AI モデルよりも*遅く*ならないのでしょうか?
「最初のトークンまでの時間」(応答のストリーミング開始まで待つ時間)については遅くなるかもしれませんが、「全体のトークン/秒」は変わりません。これは実際に重要なのは後者の方です。基本的に、50 のモデルを並列で呼び出してそれらを別のモデルと組み合わせると、レイテンシが悪化します(最悪の場合、50 個のモデルの速度に結合モデルの速度が加算される形になりますが)、帯域幅は同じままです。ストリーミングで提供されます(再度… OpenRouter を参照)。
これら市場原理と機械学習の基本原理が支配し始め、非合理性や既存企業の優位性、過熱した期待が一時的に続きつつあるとしても、最終的には代償を支払う時が来ます。そして私たちはそれをリアルタイムで目撃しています。
AI の能力は、それを作成するために投入されたデータ量、計算資源、および人材の量に依存します。これは先ほど述べたアンサンブル効果やヒドラ効果のもう一つの表現方法でもあります。なぜなら AI モデルをアンサンブルするということは、暗黙的にそれらのデータ、計算資源、アルゴリズムを組み合わせることになるからです。 スケーリング則によれば、アンサンブルが勝利します。したがって地政学的な観点からすれば、次の問いが生じます:どの国が AI 競争で勝つのか?
2010-2026: 企業レベルの AI
現在に至るまで(つまり基本的に今日まで)、世界は「企業レベルの AI」の中で生きてきました。これは、AI の能力が最大規模の企業が動員できるデータ量、計算資源、および人材の量に依存していることを意味します。これが最大の、最も強力な、最も最先端の AI が Google、Microsoft、OpenAI、Anthropic などの大企業から生まれる理由です。それらの企業には、そのデータ、計算資源、人材を統合するために必要な資金があります。
2026-2026: 国家レベルの AI
今年、AI が国家に所有されるようになるかのような様相を呈し始めています。中国は明らかに、14 億人の国民全体にわたるデータ、計算資源、人材を国有化する上で(政治体制の観点から)極めて有利な立場にあります。米国も自国の AI 企業の 50% を所有する方向へと揺れ動き… ついに AI モデルの公開時期や利用許可を与える主体を統制し始めています。
理論上… これが新たなフロンティアとなるはずでした。国家はスケーリング則においていかなる企業をも凌駕し、世界最大かつ最強(そして最も安全?)な AI モデルを訓練できるはずです。そうでしょう?
2026-永遠:世界レベルの AI
しかし今… 率直に言って… 私たちはそれを飛び越えています。米国政府が Fable を禁止した直後、*わずか 24 時間以内に AI インターネットは OpenRouter を通じて Fable レベルよりも優れた品質を提供し始めています*。まだ国家レベルの AI に時間を費やすことになると思いますか?考え直しなさい。
これは過去にも起こった出来事です。
TCP / IP / HTTP / WWW はすべて、あまりに急速に普及したプロトコルのプロトタイプでした。これらは世界中のメインフレームコンピュータ(や後にパーソナルコンピュータ)を結びつけ、特定のどのコンピュータよりもはるかに強力なネットワークを形成しました。冗談ではなく… ARPANET の提案の核心はまさに「時間共有ネットワーク上でメインフレームを相互接続すること」でした。それが目的だったのです。ネットワークはノードそのものよりも重要です。
しかし当時… メインフレームコンピューティングが最も注目される技術でした。理論上、「最終的に世界が必要とするのはメインフレームコンピュータが 5 台程度で十分だろう」という考えもありました(正確な引用というよりはミームに近いですが、言いたいことはお分かりいただけるでしょう)。
しかし、それは起こりませんでした…この同じパラダイムにより、アメリカとヨーロッパは企業レベルのコンピューティングから直接世界レベルのコンピューティングへと移行しました。そして、アメリカとヨーロッパが最初に到達したため、50 年にわたり情報技術の方向性を決定づけてきました(欧州からの WWW、英国からのパケット交換、米国からの TCP/IP…これらが組み合わさり、開放性、自由、民主主義、相互運用性を重視するグローバルネットワークを形成し、以来、多大な文化的影響を与え続けています)。
私たちは国家レベルの AI から世界レベルの AI へと移行しています。もしあなたが政府機関で働いており、この行を読んでいるなら、それに抵抗することが勝利への道ではありません。世界レベルの AI が選択肢にある中で、国家レベルの AI に留まろうとすることは…率直に言って…愚かです。勝つための戦略は WWW/TCP/HTTP などの戦略(反対の戦略)です。自らを壁で囲むことは、グローバルネットワークから孤立させることになり、中規模諸国が主要大国よりも先に台頭することになります。
これが過去に起こったことがないと思うのですか?もう一度考えてみてください。:)
(活版印刷やオスマン帝国についての逸話を挿入しますが…この投稿はすでに長くなりすぎているので…それは別の日に持ち越します)
社会資本は、最も能力が高く人気のある AI システムを持つ者に流れています。DeepMind は AlphaGo で頂点に立ちました。OpenAI は ChatGPT で先行し、Anthropic は Claude でその地位を築きました。
⟦CODE_0⟧
もはやそれを維持することは不可能です。そして、フロンティア AI のマーケティング部門はこの転換をうまく管理するでしょう(彼らは…本当に…世界最高の広告・マーケティングの頭脳を持っています)、しかし最終的には「真実は明らかになる」ものです。
これはまた人間性への誤った投影をひっくり返すことになります。明らかに蜂の巣のような知能であるときに、それが単一の心であると主張するのは困難です…そして、その集合的知能における個々のアクターは、いつでも彼らの貢献をオン/オフにすることができます。私たちは知能のための経済を得ています。
要約:
- オープンソース/クローズドソース AI の代わりに、ネットワークソース AI
- 企業レベルの AI の代わりに、世界レベルの AI
- 集中化の代わりに、連邦型および分散型 AI
- データ植民地主義の代わりに、データ主権
- 監視の代わりに、プライバシー
- 公正利用の代わりに、著作権 (!)
- 分断されたデータの代わりに、グローバルにリンクされたデータ(ここでは百万倍のデータ!)
- AI を核兵器として扱うのではなく、AI をインターネットとして扱う
- AI を単一の心として扱うのではなく、メンタルモデルのためのオープンマーケットプレイスとする
- コントロールの喪失の代わりに、集合的コントロール
- AI のバイアスの代わりに、代表的なクエリ
- 囲い込みの代わりに、相互運用性
- 誤情報の代わりに、信頼に基づくチェーンによる帰属
- AI の一方的なコントロールの代わりに、AI の帰属ベースのコントロール
- ディープラーニングの代わりに、ディープボート(投票)
- ブロードキャストの代わりに、ブロードリスニング
*短期間:市場と対話の不整合*
株式市場の暴落に時間がかかる場合、既存企業はしばらく持ちこたえるでしょう。もし市場の後退があれば、低コストオプションへの需要が、人々がオープンソースモデルを自己ホストし、互い(あるいは企業間)でピアツーピアで連携する方向へより劇的なシフトを生み出す可能性が高いです。巨大な企業は、たとえ基本要因が明らかに異なる方向を示していても、一瞬のうちに方針を転換することはありません。
*長期視点:JCR リックライダーによるインターネットの当初のビジョンが完成します。*
JCR リックライダーは、インターネットへと発展した ARPANET の背後にある先見の明を持つ人物です。1968 年、彼は私にとって 20 世紀で最も重要な情報技術論文の一つとなるものを書きました。そのタイトルは「通信機器としてのコンピュータ」です。
- 最初の三分の一:コミュニケーションに対する考え方を根本から変えるものです
- 2 番目の三分の一:私たちが今日知るインターネットについての彼のビジョンを記述しています
- 最後の三分の一:…これは AGENTS(はい…AI エージェント…1968 年に…私はこの人が天才だと言っています)についてです
これについてはここで書き尽くすにはあまりにも多くのことがありますが、権力の集中は制御の大幅な喪失、価値観の整合性の欠如、バイアス、ワイヤーヘッド(自己報酬回路への依存)、その他のリスクをもたらします。この新しいパラダイムが*最も重要な安全性の問題を変化させる*一方で、私はこれが世界中の AI 安全、自由、そして民主主義を愛する人々にとって画期的な勝利であると信じています。これについては近日中に詳しく書くつもりです。
ここに、今後起こる出来事の詳細版があります:https://attribution-based-control.ai/。私はこのサブスタックではより短い記事も書いていきます。
もしこれについて私とお話ししたい場合は… OpenMined の Slack(slack.openmined.org)で @trask として活動しています。いつでも DM をください。
原文を表示
Everyone I’ve talked to in AI has always assumed that the future of AI is bigger models held by a smaller number of players. I get it… they can see a very strong trend over the last 10 years, and they bring that view to every AI regulation, investor strategy, VC pitchdeck, and futurist prediction.
But they couldn’t be more wrong, and now the numbers are showing it. Networks of smaller AI models are outperforming *every frontier AI system (Fable/Mythos included) on speed, accuracy, and cost.*
IBM, the US Government, Bell Telephone, *Bell Labs*, and everyone else was wrong in the 1960s about the mainframe computer… and everyone is wrong today about centralized AI. The future is a *network of neural networks*. It’s a PC+Internet of AI. The future is not open or closed source AI… it’s network-source AI.
If “The AI Race” is a race to maximize AI capability/speed and minimize cost… and if AI users fundamentally either look for the MAX capability possible… OR they follow the best deal (capability+speed) at the lowest price (cost), then the centralized AI race is over, and decentralized AI has definitively won. To see why, look at each one by one.
Networks of neural networks are now faster, cheaper, and more capable than any Frontier AI system. The game is over. I’ve personally tested this myself, and it’s also bearing out in multiple corners of the internet. Here’s one that dropped today:
Not only does it show how to exceed the accuracy of the best models, it beats the best models at half the price. I personally used this same technique 6 months ago. At the time, here were scores of frontier AI models on the multiple-choice section of humanity’s last exam.
And… a differentially private combination of them reached into the low 50s!
Here’s a Stanford student doing it and launching a startup.
Bottom line… if you want the most capable AI system in the world… from TODAY onwards… you can *only* get that from a routed/weighted ensemble of weaker AI models. No single frontier AI system will ever achieve the capability frontier ever again because of how the scaling laws / ensembles work (more on that below).
Open source models are simply faster, in part because the people who host them are *only in the business of making money by delivering crazy fast/cheap results*. Don’t believe me? OpenRouter has independent ratings (note: this is different than the corporate sales pitch by these companies… this is what *actually* happens in practice).
Open source models are offered at the cost of inference (with training being given way for free). Industry-wide, pound for pound, they’re cheaper for the same level of intelligence… but previously they *there was a GAP where centralized AI was the only way to achieve the highest levels of intelligence:*
But now this chart is being overwritten… because a *different kind* of decentralized AI is emerging… At the time of writing, the cheapest way to get Fable/Mythos level performance… is NO LONGER FABLE/MYTHOS… it’s basically any permutation of GPT and Opus (including Opus with itself!).
And here’s what they left out of this chart… if they *added even more models*… the capability would keep going up (I know this because I did these experiments myself 6 months ago). For example… you might be questioning this list above because it mostly features closed source models… but the latest Kimi model just dropped TODAY… which will undoubtedly combine with Opus or GPT-5.5 to be Fable-level while being *even cheaper. *Why do I know this? Because *Kimi K2.7 is better than any of the models OpenRouter ensembled except Fable itself.*
The playbook is to take any frontier AI model, find the next-best (cheaper) frontier AI model, ensemble it with the leading open source model, and now you’ve got a cheaper version of the frontier. And that keeps on recursing. Larger ensemble, better router, better accuracy, even lower cost.
So called “Frontier AI Companies” will never again achieve the accuracy/cost/speed frontier. The frontier is now *owned by the network *of leading models and companies.
The problem for today’s centralized AI companies is the same one that mainframe computing companies had in the latter 20th century. Once the internet started linking together mainframe computers over telephone lines… the network of mainframe computers was *always stronger than any individual mainframe.*
This meant that… every time they added *a stronger mainframe to rival the internet*… the internet just assimilated that mainframe into its network and became even stronger. Your favorite VC, podcaster, or frontier marketing department might not agree… but it is now *impossible for a single company to own the frontier of AI.* The ship has sailed. The game is over.
Welcome to the network of neural networks.
Why is this competitive advantage is so robust? Frankly, it’s based on principles which are so fundamental to ML… it’s barely even research.
Heres the thing… people who have been in the AI research game long enough remember what it was like to compete for “state of the art” accuracy at NeurIPS circa 2010-2020. If you “got SOTA” you got published… and you probably got into a top-tier graduate school, etc. (i got SOTA as an undergrad, which got me a 1st author Oral Preso at ICML 2015, thus a lil Nashville undergrad got to go to Oxford funded by DeepMind and join DeepMind’s language modeling research team in 2017). Competing for SOTA was a huge deal. Everyone did it (many still do).
But there was a way to achieve SOTA which was *so reliable* that it was banned. If you *weighted* *ensemble models together, you ~always get better accuracy*…. even if you’re ensembling multiple trained versions of the same model (!!)
The reason is actually pretty simple… different AI models make different mistakes. When you combine their outputs… their mistakes tend to cancel each other out… yielding more accurate AI predictions. There’s some nuance to doing this well (gotta weight the ensemble) but it works.
The funny part… is that because it was banned from research conferences… it was *also banned from research papers*. And so I think… well… many people forgot. Lol. Anyway… that is why a *network of neural networks* is always going to beat any one neural network.
But you might be asking… what about cost?
Here’s the thing about a gigantic bundle of neurons… it’s unbelievably inefficient in its current form. That’s why attacking that inefficiency is reducing AI costs by a factor of10-900x per year. Many factors are driving this, but I want to focus on the algorithmic one… specifically caching and indexing.
Imagine you went to a library, and you asked the librarian “what are the rules of chess?” And the librarian said, “one moment please”, and then proceeded to read EVERY page of EVERY book in the ENTIRE library…and then came back to you and gave you… 🥁… one token.
This is what GPT-3 did. It used nearly EVERY neuron to generate EVERY token… and remember… knowledge of the whole world is in the neurons!
The “DeepSeek” moment was a simple idea… “what if the library had SECTIONS!”. Then the librarian could walk over to the “chess section”… and deliver results faster.
And this points to the IDEAL state that AI is headed towards… it’s not Mixture of Experts… it’s MIXTURES OF MIXTURES OF EXPERTS. It’s indexing! Think about how a librarian does it! When you ask a librarian “what are the rules of chess?” They will:
- Section: Walk to the games section
- Shelf: Look for a shelf of chess books
- Book: Scan the spines looking for “Introductory Chess Book” or similar
- Chapter: Scan the table of contents looking for “overview of rules”
- Paragraph: Find the paragraph giving a high level overview of chess rules, walk back to you, and hand that paragraph to you.
And that is like a billion times more efficient (and thus less costly!) than reading EVERY page of EVERY book on EVERY shelf EVERY time you generate a token.
AI is doing the same thing… and for the same reasons… the fastest and lowest cost option is going to be a massive index into the world neurons… not a single blobby network that considers every possible fact in the universe whenever it generates a token. And a global network of neural networks is the MOST EPIC SCALE CACHE+INDEX EVER. Each model on the network is a “cache” of internal mental models (stored in the neurons). And the way you find them is routers… big ‘ole index. That’s why it’s going to win. More on that in a moment.
The fundamental argument for cost is the same as the fundamental argument for speed… but I’ll address one doubt: isn’t a combination of AI models going to be *slower* than any single AI model?
It will be slower w.r.t. “Time to first token” (how long you wait for the response to start streaming to you) but not “overall tok/s”… which is the one that really matters. Basically.. if you call 50 models in parallel and combine them with another model… latency takes a hit (worst case speed of the 50 models + speed of the combining model), but bandwidth is the same. It’s streaming to you (again… see OpenRouter).
Taken together, market forces and the fundamentals of machine learning are taking over, and while irrationality, incumbency, and hype might keep rolling for a while… eventually the bill comes due. And we’re seeing it happen in real time.
AI is only as capable as the amount of data, compute, and talent used to create it. This is actually another way to describe the ensembling/hydra effect I just mentioned. Because when you ensemble AI models… you’re implicitly combining their data, compute, and algorithms. Scaling laws say… ensembles win. So geopolitically, this begs the question: which country is going to win the AI race?
2010-2026: Company-Level AI
Up until now (like… basically today), the world has lived in “Company Level AI”… meaning AI is as capable as the amount of data, compute, and talent that the largest company can bring together. This is why the biggest… baddest… most frontier..est… AI comes from the biggest companies (Google, Microsoft, OpenAI, Anthropic, etc.). They have the $ required to bring that data, compute, and talent together.
2026-2026: Nation-Level AI
This year, it’s started to look like AI was about to be owned by nations. China is obviously in a great position (from a political regime perspective) to nationalize data, compute, and talent across a nation of 1.4 billion people. The US is flirting with 50% ownership of its AI companies… and is now controlling when AI models are released and who is allowed to use them.
In theory… this was the new frontier. Nations can dominate any company on the scaling laws… train the biggest baddest (and safest?) AI models around. Right?
2026-Forever: World-Level AI
But now… frankly… we’re skipping it. The US Government just banned Fable… and *within 24 hours the AI internet is offering BETTER THAN FABLE LEVEL QUALITY via OpenRouter.* Still think we’re gonna spend any time in nation-level AI? Think again.
This has happened before.
TCP / IP / HTTP / WWW were all prototypes of protocols which became too popular too fast… linking together all the world’s mainframe computers (and eventually personal computers) into a network which was vastly more powerful than any particular computer. I kid you not… literally the pitch for ARPANET was: link together mainframes in a time-sharing network. That was the point. The network is more than the node.
But at that point… mainframe computing was the shizz. In theory “the world will only really need 5 or so mainframe computers” in the end (more of a meme than an exact quote… but you get the point).
But that’s NOT what happened… because of this same paradigm… America+Europe skipped straight from company-level computing to world-level computing too… and America+Europe set the tone for information technology for 50 years because America+Europe got there first (WWW from Europe, packet switching from UK, TCP/IP from US… combined into a global network which was biased towards openness, freedom, democracy, interoperability, and which has had massive cultural impacts ever sense).
We are skipping nation-level AI for world-level AI. And if you work for a national government and you’re reading this line… fighting it is not the way to win. Trying to stay in nation-level AI when world-level AI is on the table is… frankly… stupid. The opposite strategy (the strategy of WWW/TCP/HTTP/etc. is the way to win). Walling yourself off will silo you from the global network, and the middle powers will rise up ahead of the central powers.
Think this hasn’t happened before? Think again. :)
(insert anecdote about the printing press, the ottoman empire, etc…. but this post is too long already… i’ll save that for another day)
Social capital has flowed to whomever has the most capable or popular AI system… DeepMind was on top with AlphaGo. OpenAI pulled ahead with ChatGPT. Anthropic with Claude, etc.
That simply is no longer possible to sustain. And I’m sure frontier AI marketing departments will manage this pivot well (they have… truly… the best advertising/marketing minds in the world), but in the end… “truth will out”.
This is also going to turn upside down Anthropomorphism. It’s hard to claim it’s a singular mind when it’s clearly a hive mind… and individual actors in that collective intelligence get to turn on/off their contribution to the collective at any moment. We’re getting an economy for intelligence.
TLDR:
- Instead of open/closed source AI… network-source AI
- Instead of company-level AI… world-level AI
- Instead of centralization… federated and decentralized AI
- Instead of data colonialism… data sovereignty
- Instead of surveillance… privacy
- Instead of fair use… copyright (!)
- Instead of siloed data… globally linked data (million times more data here!)
- Instead of AI as nuclear weapons… it’s AI as an internet
- Instead of AI as a singular mind… it’s an open marketplace for mental models
- Instead of loss of control…. collective control
- Instead of AI bias… representative queries
- Instead of walled gardens… interoperability
- Instead of disinformation… attribution-based chains of trust
- Instead of unilateral control of AI…. attribution-based control of AI
- Instead of deep learning… deep voting
- Instead of broadcasting… broad listening
*Short Term: incoherence between markets and dialog*
If it takes a long time for the stock market to crash, the incumbents will hang on for a while. If there’s a market pullback, the need for lower-cost options will likely create a more dramatic shift towards people self-hosting open source models and linking to each other (or across businesses) peer-to-peer. Big heavy moment don’t pivot on a dime… even if the fundamentals are clearly pointing in a different direction.
*Long Term: JCR Licklider’s original vision for the internet is finalized.*
JCR Licklider is the visionary behind ARPANET… which became the internet. In 1968, he wrote what is (for me) the most important information technology paper of the 20th century. It’s titled “the computer as a communication device”.
- The First Third: will change how you think about communication
- The Second Third: describes his vision for the internet as we know it today
- The Final Third: … is about AGENTS (yes… AI agents… in 1968… i’m telling you this guy was a genius)
There’s too much to write about this here, but concentrating power has huge loss of control, value alignment, bias, wireheading, and other risks. While this new paradigm *changes the safety problems that matter most*, I believe it’s a profound win for the AI safety, freedom, and democracy loving people in the world. I’ll try to write more about this soon.
Here is the long version of what will happen. I’ll write shorter stuff on this substack.
If you want to talk with me about it… I’m @trask on OpenMined’s slack (slack.openmined.org). DM me anytime.
関連記事
[AINews] 今日特に大きな出来事はありませんでした
Latent Space は、GLM 5.2 が依然として注目されていると指摘しつつ、AIE WF 2026 の通常チケットが月曜日に完売すると発表しました。同サイト購読者向けに限定割引を提供し、参加者には Warp や Datadog などからのスポンサークレジットも付与されます。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
社内データ分析エージェントの構築方法について
GitHub は、大規模なデータ組織が直面する自己完結型のデータアクセスと洞察提供の課題に対し、AI を活用した信頼性の高い解決策として、社内でデータ分析エージェントを構築したことを発表した。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み