AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
AI Snake Oil·2025年5月1日 20:47·約22分で読める

AGIはマイルストーンではない

#AGI#AI Safety#OpenAI#Reasoning
TL;DR

AI Snake Oil は、AGI が核兵器開発のような明確なマイルストーンではないと主張し、その定義の曖昧さと実社会への影響の遅延を指摘している。

AI深層分析2026年5月3日 02:10
4
重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
3
革新性10%
4

キーポイント

1

AGI は連続的な進化であり分断点ではない

記事は AGI を技術的・社会的な不連続点(マイルストーン)ではなく、AI システムのプロパティや影響における急激な変化を伴わない連続的な進歩の一部であると論じている。

2

能力と権限の混同への警鐘

AGI に関する恐怖は「能力」と「制御不能な力(パワー)」を混同しているとし、両者を区別することで人類がコントロールを失うという危機的転換点は存在しないと主張する。

3

技術開発と社会実装の時間差

汎用 AI が一定の能力閾値に達しても、産業全体への普及と生産性向上には人間の社会的なタイムスケールが必要であり、即座に変革が起きるわけではない。

4

AGI 定義の回顧的性質

システムのプロパティとその社会的インパクトの間に確実なリンクがないため、あるシステムが AGI であるかどうかは、その後の影響を確認するまで(回顧的に)判断できない。

5

o3 の革新性と限界

o3 は強化学習を用いて検索やツール使用を推論プロセスに組み込むことで複雑な認知タスクを遂行できるが、経験から即座に新しいスキルを獲得する能力には科学的突破が必要であり、現在のアーキテクチャでは制限される。

6

AGI 定義の曖昧さ

o3 のようなシステムが特定のタスクで人間を超えれば AGI と見なせる可能性はあるが、どのタスク範囲を定義し、誰を対象とするかによって判断が変わるため、明確な閾値が存在しない。

7

AGI は観測不可能である

AGI は特定の能力の閾値に達した瞬間に現れるものではなく、その定義が曖昧であるため、実際に AGI が到来したことを明確に観測・特定することは困難である。

影響分析・編集コメントを表示

影響分析

この記事は、業界全体で沸騰している AGI 達成の議論に対して冷静な視点を提供し、技術的な到達点と社会的インパクトの乖離を指摘することで、過度な期待や恐慌を抑制する効果がある。特に、政策立案者や企業経営者に対し、AGI の定義そのものよりも、その実装と普及のプロセスに注力すべきであることを示唆しており、リスク管理や戦略策定の文脈で重要な示唆を与える。

編集コメント

AGI の定義を巡る議論が「技術的到達点」に偏りがちな中で、社会実装の時間軸やリスク評価の視点を再構築する重要な論考です。

OpenAI の最新モデル o3 のリリースに伴い、人工一般知能(AGI)がすでに達成されたかどうかについて議論が再燃している。この主張に対する標準的な懐疑論の応答は、AGI の定義に合意がないという点である。これは事実ではあるが、本質を見落としている — AGI がそれほど画期的なマイルストーンであるなら、それが構築された際に明白ではないだろうか?

本論文では、AGI はマイルストーンではないと主張する。それは AI システムの特性や影響における不連続性を表すものではない。いかなる定義に基づいて企業が AGI を構築したと宣言しても、それは実行可能な出来事にはならない。企業、開発者、政策立案者、あるいは安全性に対して何ら影響を及ぼさない。

一般目的型 AI システムが合意された能力の閾値に達したとしても、AI が産業全体に浸透して生産的な影響を実現するためには、多くの補完的なイノベーションが必要となる。この浸透は技術開発の速度ではなく、人間(および社会)の時計スケールで起こる。

AGI や壊滅的リスクに関する懸念は、しばしば能力と力を混同している。この二つを区別すれば、人類が制御を維持できなくなる AI 開発上の臨界点という考え方を拒絶できる。

AGI の定義の蔓延は、病気そのものではなく症状である。AGI が重要なのは、それがもたらすと想定される影響によるものであり、AI システム自体の性質に基づいて定義されなければならない。しかし、システム特性と影響との間の結びつきは脆弱であり、AI システムが動作する環境をどのように設計するかによって大きく依存する。したがって、特定の AI システムが変革的な影響を与えるかどうかは、そのシステムがリリースされた時点ではまだ未確定である。ゆえに、ある AI システムが AGI を構成するという判断は、回顧的にのみ意味を持って下すことができる。

AGI に対する核兵器の逆比喩

AGI の達成は、OpenAI や AI 研究コミュニティの多くにとって明示的な目標である。これは、マンハッタン計画において核兵器を構築・配備することが主要な目標であったのと同等に、マイルストーンとして扱われている。

この目標がマンハッタン計画におけるマイルストーンとして妥当だった理由は二つある。第一は観測可能性である。核兵器の開発においては、目標達成の有無について疑いの余地はない——爆発こそが観測可能性の象徴である。第二は即時的な影響である。核兵器の使用は第二次世界大戦の迅速な終結に寄与し、また新たな国際秩序をもたらした——地政学における長期的変革である。

多くの人は、AGI(人工一般知能)にはこれらの特性があるという直感を持っています。それはあまりにも強力かつ人間らしく、構築したことが明白になるでしょう。そしてすぐに、経済の広範な領域の自動化、AI 研究自体を含むイノベーションの大幅な加速、そして制御不能な超知能による人類への潜在的に壊滅的な結果など、莫大な利益とリスクをもたらすことになるでしょう。

本論文では、AGI はまさにその逆であると主張します。明確な能力閾値が存在しないため観測不可能であり、世界に対する即時的な影響はなく、長期的な経済の変容さえも不確実です。

image
image

過去の論文では、AGI を核兵器に例えることで推奨される可能性のある破滅的な政策介入に対して反対してきました。この比喩が、私たちが誤りであると考える予測や逆効果な提言を確実に生み出すことは、私たちにとって驚くべきことです。

o3 が AGI であると思うのは狂気ではありませんが、それは o3 よりもむしろ AGI の性質について多くを語っています

多くの著名な AI コメンテーターは、o3 を一種の AGI(人工一般知能)と呼んでいます。タイラー・コーエンは、「AGI が見えたとき、それが AGI だとわかるなら、私はそれを見た」と述べています。イサン・モリックは o3 を「不揃いな AGI」であると描写しています。一体何が o3 に対してこれほど大きな興奮をもたらしたのでしょうか?

o3 の核心的な革新は、推論プロセスの一部としてウェブを検索しツールを使用することを強化学習によって学習する点にあります。1 これにより、LLM(大規模言語モデル)が直接実行できるよりも複雑な認知タスクを遂行でき、かつその方法は人間に類似した形で行うことが可能になります。

比較検討を行う人物を例に考えてみましょう。彼らはいくつかの製品を確認し、それらのレビューを用いてどの機能が重要なのかをより深く理解し、その知識に基づいて検討対象となる製品のセットを反復的に拡大または縮小します。o3 はこのような作業を decent なレベルでこなせる一般化されたエージェントです。

これが AGI にとって何を意味するのかを考えてみましょう。o3 の詳細に立ち入って混乱するのを避けるため、o3 と同じアーキテクチャを持つがはるかに能力の高い将来のシステムを想像してください。例えば、オンライン状態であれば、タスクに必要な正しいウェブページや知識を、見つけるのがどれだけ困難であっても常に特定できます。必要に応じてインターネットからコードをダウンロードして実行し、タスクを解決することも可能です。これらに科学技術的な画期的発見は不要であり、必要なのはエンジニアリングの改善とさらなるトレーニングだけです。

同時に、科学的な改善がない限り、このアーキテクチャは深刻な制限を課します。例えば、この将来のシステムは、トレーニングへの明示的な更新を除いて、経験から新しいスキルを獲得することはできません。その場で学習できる AI システムを構築することは、未解決の研究課題です。

仮想的なシステムが AGI と言えるでしょうか?おそらく yes です。多くの AGI の定義に共通するのは、広範なタスクにおいて人間を上回る能力を持つことです。タスクのセットをどの程度狭く定義し、各タスクに関連する人間の集団をどの程度広く定義するかによって、この将来の o3 に似たモデル/エージェントがいくつかの AGI 定義を満たすことは十分にあり得ます。

例えば、大規模言語モデル自体がチェスにおいてせいぜい平均的な性能しか出せないという事実にもかかわらず、チェスにおいては人間を超えた能力を発揮するでしょう。モデルはツールを使用し、インターネットを検索し、コードをダウンロードして実行できることを思い出してください。タスクがチェスを指す場合、システムはチェスエンジンなどをダウンロードして実行します。

多くのタスクにおいて人間レベルまたはそれ以上の性能を発揮し、おそらくいくつかの AGI 定義を満たすとしても、実際の世界における多くのタスクではひどく失敗するでしょう。その理由については後ほど触れます。

これらは何らかの意味を持つのでしょうか。もちろんです。AI 企業のリーダーたちは、数年以内に AGI を実現すると非常に大きな声で予測し、約束してきました。彼らが近い将来のシステムを AGI と宣言することには莫大なインセンティブがあり、逆にそれをしないことには潜在的に莫大なコストが生じます。おそらく AI 企業の評価の一部はこれらの約束に基づいているため、AGI が実現されなければバブルが崩壊する可能性もあります。AI 開発におけるリーダーとして見られることは、市場シェアと収益の向上を助け、人材へのアクセスも改善する可能性があります。

したがって、企業が AGI の構築を主張した場合、どのような結果が生じるのでしょうか?これについては、本稿の後半で分析します。

「AI Snake Oil」は AI に関する過剰な宣伝を否定し、新しい進展について証拠に基づく分析を発表しています。

AGI は経済に衝撃を与えるものではありません。なぜなら、浸透には数十年がかかるからです。

AGI をマイルストーンとして扱い、その宣言を真剣に受け止めるべきだという主張の一つは、AGI が急速な経済的影響をもたらす可能性があり、それがポジティブなものでもネガティブなものでも構わないという点です。例えば、希少性がなくなる世界、貨幣の概念が終焉を迎えること、あるいは突然の大規模な失業などが挙げられます。

しかし、AI の経済的インパクトは、それが経済全体に普及されて初めて実現されるものです。技術的な進歩はこのインパクトを実現するために必要ですが、それだけでは不十分です。過去における汎用技術、例えば電気、コンピューティング、インターネットについては、根本的な技術的進歩が社会全体に浸透するまでに数十年を要しました。産業革命の奇跡とは、高い成長率そのものではなく(年間成長率は平均して 3% を下回っていました)、数十年にわたる持続的な成長期間こそが真の奇跡でした。

AI の普及には多くのボトルネックが存在します。有用な製品やアプリケーションの開発、これらの製品を活用する労働力の育成、AI 利用を可能にするための組織変革の実施、そして企業が AI を採用することを促進する法制度と規範の確立などです。過去の汎用技術と同様に、この普及プロセスが展開されるにつれて、AI の経済的インパクトも数十年をかけて実現されると予想されます。

論文「AI as Normal Technology」では、なぜそう考えるのかについて詳細な論拠を提示しています。能力の急速な向上が即座に経済的なインパクトをもたらすという考え方は、AI の過去と現在と完全に矛盾しており、将来においてこれが変わる理由は何もありません。

AGI の一つの定義は、経済的に価値のある仕事の大部分において人間を上回る AI システムである。この意味での AGI が実現された場合、大規模かつ突然の雇用喪失を招くかもしれないと懸念されるかもしれない。しかし、人間は動く標的である。拡散のプロセスが進み、自動化されたタスクの生産コスト(ひいてはその価値)が低下するにつれ、人間は未だ自動化されていないタスクへと適応し移行していくだろう。技術進歩、製品開発、そしてその拡散のプロセスは継続される。

AGI は世界秩序に急速な変化をもたらさない

米国と中国は、それぞれ AGI の構築を競う AI 軍拡競争にあるとよく説明される。最初にそれを構築する国が決定的な戦略的優位性を有し、将来永続的に世界秩序を支配することになると仮説されている。

この物語は理にかなっていない。AI モデルを作成するために必要な知識や、モデル自体の能力は、国境を越えて急速に普及する傾向があるからだ。何十万もの AI 技術者が存在し、彼らは政府研究所ではなく民間部門で働いているため、そのような規模で秘密を維持することは現実的ではない。

発明—この場合は AI モデルの開発—は競争優位性の源泉として過大評価されている。技術的な進展はおそらく国境を越えてほぼ同調して進むと予想すべきである。米国の企業が現在最前線にいるとしても、永続的な優位性を期待すべきではない。

多くの人は、技術的能力の普及の容易さを理解しておらず、おそらく核兵器に関する思考モデルの影響を受けているため、その速さに驚かされています。これが今年初めに起きた「DeepSeek モーメント」の原因であり、アナリストたちは AI 能力がどれほど急速に普及するかを認識しておらず、結果として新興企業(特に中国からの)がこれほど短期間で追いつくことを予想していなかったのです。

一部の人は、数ヶ月の優位性さえも決定的になると主張しています。しかし、私たちは同意しません。大国間の競争という文脈において重要な問いは、どの国が AGI を最初に構築するかではなく、むしろどの国が普及をより効果的に可能にするかです。ジェフリー・ディン(Jeffrey Ding)の研究が示すように、国内または国際的な AI の発明やイノベーションを実際に活用して生産性を向上させる企業や政府の有効性は、汎用技術の経済的影響を決定する上ではるかに重要です。

中国の AI 企業は、AI モデルと能力の点では米国の主要企業より最大で 6〜12 ヶ月遅れですが、普及を可能にするいくつかの重要な指標においては米国に大きく後れをとっています。具体的には、デジタル化(Digitization)、クラウドコンピューティングの導入率、および労働者の訓練です。これらすべては、産業全体に AI の進歩を生産的に普及させるために必要不可欠な要素です。これが米国の実際の競争優位性の源泉なのです。

もちろん、これは今後数年間で変化する可能性があります。しかしもし変化するのであれば、それは AGI の開発ではなく、普及を促進する政策変更の結果として生じるでしょう。また、いかに迅速に政策を変更したとしても、国々が一夜にして達成できるようなことではありません。普及は通常数十年をかけて進行します。

これらはすべて、政策決定者が油断すべきだという意味ではありません。しかし、AGI に固執するのではなく、既存の AI を含む生産的で安全な普及を可能にすることに焦点を当てるべきだということです。

AGI の長期的な経済的影響は不確実です

即座に経済的な影響を持たなくても、AGI が例えば年間 10% の GDP 成長率をもたらす可能性があり、それが数十年かけて大きな成果につながることはないでしょうか?

そうなるかもしれません。しかし、なぜそしてどのようにそれが起こるのかについては、まだ全く明確ではありません。

歴史的に見て、このような成長の加速は非常に稀にしか起こりませんでした。産業革命にはそのような効果がありましたが、インターネットにはほとんど GDP への影響がありませんでした。GDP が測るべき適切な指標ではないと考えている場合でも、GDP 成長率の質的な変化は、あなたが関心を持つ経済における根本的な変化の良い代理指標となります。

問題は、成長を加速させるためには進歩に対するボトルネックを排除する必要があることです。これは多くの AI 推進者が想定しているよりも困難です。AI はセクター間で不均一な影響をもたらす可能性が高く、長期的な成長は最も弱いセクターによってボトルネックに陥るでしょう。

劇的な効果を主張する人々は、実際ボトルネックとなっているものが何かについて誤ったメンタルモデルを持っていることが多い。例えば、安価な科学技術革新が進展を解き放つと信じたくなるが、新たな知見の生産は実際には科学におけるボトルネックではない。

より広く言えば、進展は技術だけでなく、適切な前提条件—補完的な革新や文化的・経済的・政治的要因—にも依存する。産業革命を生み出すのに蒸気機関の発明だけで十分だったなら、ローマ帝国がそれを実行しただろう。

現在の法律、規範、制度、政治は、技術的潜在能力がはるかに少なかった時代に形成されたものである。すでに、より多くの公共インフラを建設するような単純なタイプの成長に対する機会を窒息させている。広範な認知自動化がもたらす可能性のある経済的利益を実感するためには、必要となる構造的変化の規模は想像を絶するほど大きい。

結論として、AGI からの長期的影響の範囲と性質はまだ明らかではなく、私たちが取る補完的な行動に依存する。長期的含意は AGI そのものの属性ではない。

AGI のミスマッチリスクは権力と能力を混同している

一方で、AGI は AI の社会的リスクにおける転換点となる可能性がある。制御不能な状態を引き起こし、大規模な社会的損害をもたらすか、あるいは人類の絶滅さえも招くだろうか?

AGI のリスクに関する議論では、環境を改変する能力である「パワー」と、指定されたタスクを正しく解決する容量である「キャパビリティ」が混同されがちです。キャパビリティは AI システムの内在的な性質ですが、パワーは AI システムが動作する環境をどのように設計するかという問題であり、人間はこの設計に対して主体性を持っています。この区別はしばしば見落とされています。

ダリオ・アモダイ(Dario Amodei)による「強力な AI」の定義5 を考えてみましょう。彼はまず、「未解決の数学的定理を証明する」「極めて優れた小説を書く」「ゼロから困難なコードベースを作成する」といった、強力な AI のキャパビリティの説明から始めます。この基準は AI のキャパビリティの一例であり、AI システムのレベルで議論することができます。

しかし、彼はその後、AI システムに動作を許可する環境の性質について記述に移ります。そこには「インターネット上で行動を起こす」「人間に対して指示を出したり受けたりする」「資材を発注する」「実験を指揮する」「動画を見る」「動画を作成する」などが含まれます。これは AI システムに付与されるパワーの一例です。これは AI システムが動作する環境に依存しており、その環境がどのようにして AI のキャパビリティをパワーへと変換するかを決定します。

私たちは、AI の能力が継続して向上していくことを期待しています。しかし、能力レベルに関わらず、AI が人間の監視なしに自律的に動作する権限や自律性を与えられないよう、AI を単なるツールとして維持することを選択することは可能です。「AI を通常の技術として」というエッセイでは、企業間の軍拡競争、権力追求、超人的な説得能力、欺瞞的アライメントなど、この主張に対する一般的な反論すべてに対処しています。

論文では、適切な監視体制なしに AI を導入することに対して強力なビジネス上のインセンティブが働くと主張しており、必要に応じてこれらのインセンティブを規制によって補強すべきであると述べています。これは歴史的に見ても、自動運転車から AI アシスタントに至るまで、あらゆる分野で当てはまる事実です。AI の能力が「AGI」という任意に設定された転換点に達したとしても、この傾向が突然逆転するとは考えていません。

AGI は近未来の超知能を意味しない

AGI をマイルストーンとみなすもう一つの理由は、AGI が構築された直後に AI システムが再帰的に自己改善し、AGI が将来のモデルバージョンを訓練してはるかに高度な能力を持つものへと進化させ、「知性の爆発」を引き起こすという見方です。その後まもなく、あらゆる conceivable なタスクにおいて人間の能力を遥かに凌駕する超知能 AI(AI システム)が出現し、その結果、超知能 AI が人間の利益とどの程度「アライメント」されているかによって、ユートピアあるいはディストピアのどちらかが訪れることになります。

通常の技術的視点では、この物語を疑う大きな理由が二つあります。第一に、AI 手法における任意の速度向上が可能であっても、イノベーションと普及は人間のスピードで行われると考えられるためです。これは以下の表に要約されています。

image
image

他の汎用技術と同様に、AI の影響は手法や能力が向上した時点ではなく、その改善がアプリケーションに翻訳され、経済の生産部門を通じて普及したときに実現されます。[Source]

第二に、AI が AI 研究の実施を支援するという事実は、このプロセスが任意に加速できることを意味するものではありません。今日でも、AI は AI 研究の相当部分を自動化するためにすでに使用されています。しかし、AI 手法における進展には多くのボトルネックが存在します。例えば、特定の能力を実現するために必要となるデータ収集や現実世界との相互作用といった社会的性質、計算リソースとコストの限界、あるいは真のブレークスルーを可能にするアイデアを見捨てて、人気のある直感的なアイデアに群がる現象などが挙げられます。

私たちはこの点について誤っている可能性があり、再帰的自己改善が可能であれば、AI 手法の進展における無制限な加速をもたらす可能性があります。これにはいくつかの興味深い含意があり、広範な普及が遅くなる場合でも、影響に不連続性が生じる可能性があります。これらの理由から、再帰的自己改善に対する早期警戒システムを備えておくことは重要です。しかし、これは AGI の定義には含まれていません。私たちは、再帰的自己改善からは遠く離れた状態であっても AGI を持っている可能性があり、その逆もまた然りです。

AGI が構築された時期はわからない

AGI や関連概念には無数の定義がありますが、Jasmine Sun は 20 以上の定義を有用にまとめたものを持っています。しかし、それらはすべて 3 つの広範なカテゴリに分類されます:それは世界に対するシステムの影響力に基づくもの、内部構造に基づくもの、あるいは制御された環境における行動に基づくものです。私たちは、各スタイルの定義には致命的な欠陥があることを示します。その結果生じる基準は、私たちが理想的に求めるものに対して、厳しすぎるか、または緩すぎることになります。

これらのギャップを理解することは、なぜ人々が AGI がどのような姿になるかについて異なる直感を持っているのか、そして「見た瞬間にわかる」という基準が失敗し、今後も失敗し続けるのかを示すことにもなります。

OpenAI の 2018 年における AGI(汎用人工知能)の定義は、「経済的に価値のある仕事の大部分において人間を上回る、極めて自律的なシステム」でした。私たちが AI の影響に関心を持っているという観点からすれば、この定義は非常に有用である可能性があります。もし AI が経済的に価値のある仕事のほとんどにおいてすべての人間を上回るのであれば、その影響力が疑いの余地なく大きくなるでしょう。

しかし、はっきりさせておきましょう——これは AI システム自体の性質ではなく、世界の状態における性質です。それは少なくとも、私たちが行う補完的なイノベーションや、AI を組織や制度にどの程度統合するかという点にも深く関わっています。実験室で AI システムを孤立してテストし、それが人々の仕事において人間を上回るかどうかを問うことは、あり得ないことです。

⟦CODE_0⟧

原文を表示

With the release of OpenAI’s latest model o3, there is renewed debate about whether Artificial General Intelligence has already been achieved. The standard skeptic’s response to this is that there is no consensus on the definition of AGI. That is true, but misses the point — if AGI is such a momentous milestone, shouldn’t it be obvious when it has been built?

In this essay, we argue that AGI is not a milestone. It does not represent a discontinuity in the properties or impacts of AI systems. If a company declares that it has built AGI, based on whatever definition, it is not an actionable event. It will have no implications for businesses, developers, policymakers, or safety. Specifically:

Even if general-purpose AI systems reach some agreed-upon capability threshold, we will need many complementary innovations that allow AI to diffuse across industries to realize its productive impact. Diffusion occurs at human (and societal) timescales, not at the speed of tech development.

Worries about AGI and catastrophic risk often conflate capabilities with power. Once we distinguish between the two, we can reject the idea of a critical point in AI development at which it becomes infeasible for humanity to remain in control.

The proliferation of AGI definitions is a symptom, not the disease. AGI is significant because of its presumed impacts but must be defined based on properties of the AI system itself. But the link between system properties and impacts is tenuous, and greatly depends on how we design the environment in which AI systems operate. Thus, whether or not a given AI system will go on to have transformative impacts is yet to be determined at the moment the system is released. So a determination that an AI system constitutes AGI can only meaningfully be made retrospectively.

Nuclear weapons as an anti-analogy for AGI

Achieving AGI is the explicit goal of companies like OpenAI and much of the AI research community. It is treated as a milestone in the same way as building and delivering a nuclear weapon was the key goal of the Manhattan Project.

This goal made sense as a milestone in the Manhattan Project for two reasons. The first is observability. In developing nuclear weapons, there can be no doubt about whether you’re reached the goal or not — an explosion epitomizes observability. The second is immediate impact. The use of nuclear weapons contributed to a quick end to World War 2. It also ushered in a new world order — a long-term transformation of geopolitics.

Many people have the intuition that AGI will have these properties. It will be so powerful and humanlike that it will be obvious when we’ve built it. And it will immediately bring massive benefits and risks — automation of a big swath of the economy, a great acceleration of innovation, including AI research itself, and potentially catastrophic consequences for humanity from uncontrollable superintelligence.

In this essay, we argue that AGI will be exactly the opposite — it is unobservable because there is no clear capability threshold that has particular significance; it will have no immediate impact on the world; and even a long-term transformation of the economy is uncertain.

image
image

In previous essays, we have argued against the likely disastrous policy interventions that some have recommended by analogizing AGI to nuclear weapons. It is striking to us that this analogy reliably generates what we consider to be incorrect predictions and counterproductive recommendations.

It isn’t crazy to think that o3 is AGI, but this says more about AGI than o3

Many prominent AI commentators have called o3 a kind of AGI: Tyler Cowen says that if you know AGI when you see it, then he has seen it. Ethan Mollick describes o3 as a jagged AGI. What is it about o3 that has led to such excitement?

The key innovation in o3 is the use of reinforcement learning to learn to search the web and use tools as part of its reasoning chain.1 In this way, it can perform more complex cognitive tasks than LLMs are directly capable of, and can do so in a way that’s similar to people.

Consider a person doing comparison shopping. They might look at a few products, use the reviews of those products to get a better sense of what features are even important, and use that knowledge to iteratively expand or shrink the set of products being considered. o3 is a generalist agent that does a decent job at this sort of thing.

Let’s consider what this means for AGI. To avoid getting bogged down in the details of o3, imagine a future system whose architecture is identical to o3, but is much more competent. For example, it can always find the right webpages and knowledge for the task as long as it’s online, no matter how hard it is to locate. It can download and run code from the internet to solve a task if necessary. None of these require scientific breakthroughs, only engineering improvements and further training.

At the same time, without scientific improvements, the architecture imposes serious limits. For example, this future system cannot acquire new skills from experience, except through an explicit update to its training. Building AI systems that can learn on the fly is an open research problem.2

Would our hypothetical system be AGI? Arguably, yes. What many AGI definitions have in common is the ability to outperform humans at a wide variety of tasks. Depending on how narrowly the set of tasks is defined and how broadly the relevant set of humans for each task is defined, it is quite plausible that this future o3-like model/agent will meet some of these AGI definitions.

For example, it will be superhuman at playing chess, despite the fact that large language models themselves are at best mediocre at chess. Remember that the model can use tools, search the internet, and download and run code. If the task is to play chess, it will download and run a chess engine.

Despite human-level or superhuman performance at many tasks, and plausibly satisfying some definitions of AGI, it will probably fail badly at many real-world tasks. We’ll get back to the reasons for that.

Does any of this matter? It does. Leaders at AI companies have made very loud predictions and commitments to delivering AGI within a few years. There are enormous incentives for them to declare some near-future system to be AGI, and potentially enormous costs to not doing so. Perhaps some of the valuation of AI companies is based on these promises, so without AGI there might be a bubble burst. Being seen as leaders in AI development could help improve market share and revenues, and improve access to talent.

So, if and when companies claim to have built AGI, what will be the consequences? We'll analyze that in the rest of this essay.

AI Snake Oil debunks AI hype and publishes evidence-based analysis of new developments.

AGI won't be a shock to the economy because diffusion takes decades

One argument for treating AGI as a milestone — and taking declarations of AGI seriously — is that AGI could lead to rapid economic impacts, both positive and negative, such as a world without scarcity, an end to the concept of money, or sudden mass joblessness.

But AI's economic impact is only realized when it is adopted across the economy. Technical advances are necessary, but not sufficient, to realize this impact. For past general-purpose technologies, such as electricity, computing, and the internet, it took decades for the underlying technical advances to diffuse across society. The miracle of the Industrial Revolution wasn't the high growth rate — annual growth rates averaged below 3% — but the sustained period of decades of growth.

There are many bottlenecks to the diffusion of AI: developing useful products and applications, training the workforce to utilize these products, implementing organizational changes to enable AI use, and establishing laws and norms that facilitate AI adoption by companies. Like past general-purpose technologies, we expect the economic impacts of AI to be realized over decades, as this process of diffusion unfolds.

In the paper AI as Normal Technology, we present a detailed argument for why we think this will be the case. The idea that rapid increases in capability lead to rapid economic impacts is completely inconsistent with the past and present of AI, and there is no reason to expect that this will change in the future.

One definition of AGI is AI systems that outperform humans at most economically valuable work. We might worry that if AGI is realized in this sense of the term, it might lead to massive, sudden job displacement. But humans are a moving target. As the process of diffusion unfolds and the cost of production (and hence the value) of tasks that have been automated decreases, humans will adapt and move to tasks that have not yet been automated. The process of technical advancements, product development, and diffusion will continue.

AGI will not lead to a rapid change in the world order

The US and China are often described as being in an AI arms race, with each country racing to build AGI. It is hypothesized that the country to build it first would have a decisive strategic advantage — resulting in dominance in the world order for the foreseeable future.3

This narrative doesn’t make sense because the knowledge required to create AI models, and model capabilities themselves, tend to proliferate quickly between countries. There are hundreds of thousands of AI technologists, and they work in the private sector rather than government labs, so it is not feasible to keep secrets at that scale.

Invention — in this case, AI model development — is overrated as a source of competitive advantage. We should expect technological developments to roughly keep pace across countries. Even though US companies are currently at the forefront, we shouldn't expect a lasting advantage.4

Many people haven't appreciated the ease of proliferation of technological capabilities — perhaps due to the nuclear weapons mental model — and have been caught by surprise. This is what led to the "DeepSeek moment" earlier this year, since analysts did not realize how quickly AI capabilities can proliferate, and as a result, were not expecting upstarts (especially from China) to catch up so quickly.

Some people argue that even an advantage of a few months will be critical. We disagree. The important question in the context of great power competition is not which country builds AGI first, but rather which country better enables diffusion. As Jeffrey Ding has shown, the effectiveness of companies and governments in actually utilizing AI inventions and innovations, whether domestic or international, to improve productivity is far more important for determining the economic impacts of general-purpose technologies.

While Chinese AI companies are at most 6-12 months behind leading US companies in terms of AI models and capabilities, China lags significantly behind the US in several key indicators that might enable diffusion: Digitization, cloud computing adoption, and workforce training. All of these are required to enable the productive diffusion of AI advances across industries. This is the actual source of American competitive advantage.

Of course, this could change in the coming years. But if it does, it will result from policy changes to promote diffusion rather than the development of AGI. And it is not something countries can accomplish overnight, regardless of how quickly they change policy. Diffusion typically unfolds over decades.

None of this means that policymakers should be complacent. But it does mean that rather than fixating on AGI, they should focus on enabling productive and safe diffusion, including of existing AI.

The long-term economic implications of AGI are uncertain

Even if it doesn’t have immediate economic impacts, could AGI unlock, say, 10% annual GDP growth that could add up to something big over a few decades?

Maybe. But it is far from clear why and how this will happen.

Historically, this kind of acceleration in growth has happened very few times — the industrial revolution had this effect, but not the internet, which barely had any impact on GDP. Note that even if you don’t think that GDP is the right thing to measure, a qualitative change in the GDP growth rate is a good proxy for whatever fundamental change in the economy you care about.

The problem is that accelerating growth requires eliminating bottlenecks to progress. That’s harder than most AI boosters assume. AI will likely have uneven effects across sectors, and long-term growth will be bottlenecked by the weakest sector.

Those arguing for dramatic effects often have an incorrect mental model of what the bottlenecks actually are. For example, while it is tempting to believe that cheap scientific innovation will unlock progress, the production of new findings is actually not the bottleneck in science.

More broadly, progress depends not just on the technology but on having the right preconditions — complementary innovations as well as cultural, economic, and political factors. If all it took to create the industrial revolution was the invention of steam power, the Roman Empire would have done it.

Our current laws, norms, institutions, and politics evolved in a time of much less technological potential. They are already choking opportunities for straightforward types of growth, such as building more public infrastructure. To reap the economic benefits that broad cognitive automation can potentially bring, the degree of structural change that needs to happen is unfathomably greater.

In conclusion, the extent and nature of long-term impacts from AGI remain to be seen and depend on what complementary actions we take. The long-term implications are not a property of AGI itself.

Misalignment risks of AGI conflate power and capability

On the flip side, AGI could be a turning point for AI's societal risks. Could it cause loss of control, massive societal harm, or even human extinction?

Discussions of AGI risks conflate power — the ability to modify the environment — with capability — the capacity to solve specified tasks correctly. Capability is an intrinsic property of an AI system, whereas power is a matter of how we design the environment in which AI systems operate. And humans have agency over this design. This distinction is often overlooked.

Consider Dario Amodei's definition of "powerful AI".5 He begins with a description of the capabilities of powerful AI, such as being able to "...prove unsolved mathematical theorems, write extremely good novels, write difficult codebases from scratch." This criterion is an example of AI capabilities, and we can discuss them at the level of AI systems.

But he then moves on to describe properties of the environment in which we allow AI systems to operate, which includes "...taking actions on the internet, taking or giving directions to humans, ordering materials, directing experiments, watching videos, making videos, and so on." This is an example of the power afforded to an AI system. It depends on the environment within which the AI system operates, which determines how AI capabilities are translated into power.

We do expect AI capabilities to keep increasing. But regardless of capability level, we can choose to ensure that AI remains a tool and is not given power and autonomy to operate without human oversight. In the AI as Normal Technology essay, we address all the usual counterarguments to this, including arms races among companies, power seeking, superhuman persuasion, deceptive alignment, and more.

We argue in the paper that there will be strong business incentives against deploying AI without adequate oversight, and that these incentives can and should be buttressed by regulation when necessary. This has historically been the case in areas ranging from self-driving cars to AI assistants. We don’t expect this trend to suddenly flip once AI capabilities reach a presumed tipping point that we arbitrarily designate as AGI.

AGI does not imply impending superintelligence

Yet another reason to consider AGI a milestone is the view that shortly after we build AGI, AI systems could recursively self-improve — AGI could train future versions of models that become far more capable, leading to an "intelligence explosion." Soon afterwards, we would get superintelligent AI (AI systems that far exceed human abilities on any conceivable task), leading to either utopia or dystopia, depending on how well superintelligent AI is “aligned” with human interests.

In the normal technology view, there are two big reasons to doubt this narrative. The first is that even if arbitrary speedups in AI methods are possible, we think that innovation and diffusion will happen at human speed, as summarized in this table.

image
image

Like other general-purpose technologies, the impact of AI is materialized not when methods and capabilities improve, but when those improvements are translated into applications and are diffused through productive sectors of the economy. [Source]

Second, the fact that AI would help conduct AI research does not imply that this process can be arbitrarily accelerated. AI is already used to automate a significant portion of AI research today. But there are many bottlenecks to progress in AI methods, such as the social nature of data collection and real-world interaction that might be required for achieving certain capabilities, computational and cost limits, or herding around popular or intuitive ideas while ignoring the ones that enable true breakthroughs.

We could be wrong about this, and recursive self-improvement could be possible, leading to unbounded speedups in progress in AI methods. And this might have some interesting implications, including some discontinuities in impact, even if widespread diffusion will be slower. For these reasons, it is important to have early warning systems for recursive self-improvement. However, this is not captured by AGI definitions. We might well have AGI while being far from recursive self-improvement, or vice versa.

We won’t know when AGI has been built

There are endless definitions of AGI and related concepts — Jasmine Sun has a useful compilation of over 20 definitions — but they fall into three broad categories: they can be based on the system’s impact on the world, its internals, or its behavior in controlled settings. We will show that each style of definition has a fatal flaw. It leads to criteria that are either too strict or too weak compared to what we ideally want.

Understanding these gaps also shows why people have different intuitions regarding what AGI will look like, and why “we’ll know it when we see it” has failed as a criterion and will continue to fail.

OpenAI's 2018 definition of AGI was "highly autonomous systems that outperform humans at most economically valuable work". From our perspective — our interest being in the impacts of AI — this definition is potentially very useful. If AI outperformed [all] humans at most economically valuable work, it would be unquestionably impactful.

But let’s be clear — this is not a property of an AI system. It is a property of the state of the world. It has at least as much to do with the complementary innovations that we make and the extent to which we choose to integrate AI into our organizations and institutions. It would be absurd to try to test an AI system in isolation in the lab and ask whether it outperforms people at their jobs. It

この記事をシェア

関連記事

The Zvi★42026年6月10日 07:34

計画と覚書を伴う三つの実験室

Anthropic は安全に配布可能な Claude の新バージョン「Claude Fable 5」をリリースした。しかし、本ブログは新モデルの機能を十分に検証するまで数日間の猶予を設け、詳細なレビューは金曜または月曜から開始すると明言している。

Latent Space★42026年6月4日 04:27

非公式 AI の限界を超える - Carina Hong, Axiom Math

2025 年、7 ヶ月目のスタートアップ企業「Axiom」が、難関の数学試験「プットナム試験」で全 12 問を解き、最優秀学生や既存 AI システムを上回る成績を収めた。

Ars Technica AI★42026年6月3日 03:19

数学者が AI の専門職への脅威を警告、業界の侵食に懸念表明

オランダのライデン大学で開かれた会議を経て結成された研究者グループが、AI が数学研究に及ぼす課題や技術業界の影響拡大に対し、専門職としての危機感を示した声明を発表しました。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む