AAIニュース
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業
AAIニュース

世界中のAI最新情報を日本語で。毎時自動収集・翻訳・要約。

コンテンツ

最新ニュースAI日報週報

分析

トレンド企業動画

サイト

についてRSSお問い合わせ
© 2026 ainew.jp — All rights reserved.特定商取引法に基づく表記
ニュース一覧元記事を開く
Import AI·2026年5月11日 21:46·約23分

Import AI 456:RSI と経済成長、AI 規制への「過激な選択肢」、そしてニューラルコンピュータ

#AI規制#ガバナンス#リスク管理#政策提言#民主主義
TL;DR

インスティテュート・フォー・ロー・アンド・AI が提唱する「ラジカルなオプション性」の概念は、不確実な未来の危機に備え、政府が過度な規制を避けつつも必要な権限と情報を早期に構築すべきだと主張している。

AI深層分析2026年5月11日 23:04
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

ラジカルなオプション性の定義

民主主義政府が変化する状況下でAIシステムを適切に統治する能力を維持するため、短期的には過度な規制を避けつつ、将来的に必要な制度や情報チャネルを急速に構築するアプローチ。

2

投資とコストの考え方

AI開発の潜在的リスクが甚大であるため、不確実なリターンであっても政府は莫大な資金、努力、政治的資本を「オプション性の維持」に投じるべきだと提言している。

3

具体的施策:情報収集と監査

企業の透明性要件や報告義務の導入に加え、第三者による検証制度(監査)を確立し、AIシステムの情報を効果的に収集・管理する枠組みの構築。

4

具体的施策:内部告発と柔軟な規制

最前線の研究所で働く従業員がリスクを報告できる保護措置に加え、「もし〜なら」という条件付きルールや、目標は設定しつつ手段は企業に委ねる柔軟な定義の導入。

5

政府と専門家の能力強化の必要性

AIシステムの能力と安全性を評価するための政府・第三者機関の能力開発、およびモデル重みやアルゴリズム秘密のセキュリティ向上には、AISIやCAISIなどの技術人材への投資が不可欠である。

6

規制の柔軟性と民主的正統性のバランス

緊急時の対応力を高めるために規制手続きを簡素化する柔軟性を追求することは、民主的正統性(例えばパブリックコメント期間の省略)と緊張関係にあるが、政府権力の濫用リスクを回避するためには限定的なアプローチが推奨される。

7

民間ガバナンスの限界と公共部門の役割

民間主体によるガバナンスや検証機関への依存は最終的に政府内の技術的専門知識に頼らざるを得ないため、公的な技術能力の維持が重要である。

影響分析・編集コメントを表示

影響分析

この提言は、現在のAI規制議論における「予防原則に基づく厳格な規制」と「自由放任」の対立軸を打破する重要なパラダイムシフトを示唆しています。政府が技術の進歩に追いつくための時間的猶予を得つつ、危機発生時に即座に対応できる権限と情報を事前に握っておくという戦略は、今後の各国のAIガバナンス法制や国際協調の枠組み設計に大きな影響を与える可能性があります。

編集コメント

「規制するか、しないか」という二項対立を超え、政府が未来の危機に備えて「選択肢(オプション)」を確保する戦略的アプローチは、実務的なガバナンス議論において非常に示唆に富んでいます。特に、不確実な将来への投資コストを許容するという視点は、従来のコストベネフィット分析とは異なる発想が必要であることを浮き彫りにしています。

imageimageAI 研究に関するニュースレター「Import AI」へようこそ。このニュースレターは、arXiv(アーカイブ)とカプチーノ、そして読者からのフィードバックによって支えられています。ご支援いただける場合は、ぜひ購読をご検討ください。

今すぐ購読する

規制すべきか、それとも規制しないのか。第三の道があります:「ラディカル・オプショナリティ(Radical Optionality)」

…政府は、将来の危機で必要となる可能性のあるツールに、今から投資すべきです…

法と AI 研究所(Institute for Law & AI)の研究員らが、「ラディカル・オプショナリティ」というアプローチについて論じています。これは、強力な AI が世界を大規模に混乱させた場合に備え、政府が将来必要となる可能性のあるツールを自ら用意しておくという考え方です。

「その核心は、状況の変化に応じて変革的な AI システムの統治方法について、民主主義政府が適切な判断を下す能力を維持することにあります。短期的には、過度な規制を避けつつ、多様なシナリオに有能に対応するために必要な制度、情報チャネル、法的権限を急速に構築することを意味します。」

鍵となるアイデア – 不確実な未来のために今投資する:AI 開発のリスクが極めて大きいため、「政府は、オプション性を維持するために、莫大な資金、努力、政治的資本を投じる用意があるべきだ」と彼らは記述している。つまり、これは非常に大きな問題であり、不確実なリターンであっても、多額の資金を今投入しておくべきだという意味である。「政府は逆効果となる介入には警戒すべきだが、ネットプラスの結果をもたらす可能性が高い現実的な措置の実際の金銭的コストについては、それほど心配する必要はない」。

具体的な内容:彼らはまた、いくつかのカテゴリーにおいて、いくつかの具体的な介入策も推奨している。

情報収集機関:透明性要件。企業は自社の AI システムに関する情報を公開する必要がある。報告要件。企業は特定の情報を政府機関に共有することが義務付けられる。これらが整備された後、第三者が透明性と報告規則の対象とする情報の真偽を検証できる監査制度を確立する。

内部告発者保護:フロンティア研究所の従業員がリスクに関する情報を報告できるように確保する。

政府内および政府間での情報共有:政府が効果的に調整し、特に AI の進展に関する機密情報を扱う議論を促進できるよう確保する。これは、AI 開発に不可欠と見なされるサプライチェーンを強化・保護するために、特に重要である可能性がある。

柔軟なルールと定義:条件付きの「もし〜なら」規制コミットメント、あるいはリスク低減など高レベル目標を設定し、企業にその具体的な方法を自由に定義させるアプローチによって、早期の規制を回避する。これには、時間とともに進化できる柔軟な定義、またはそのような定義を策定する必要性が深く関わっている。

評価と検証:AI システムの能力と安全性の側面を評価するための政府および第三者の能力を開発する。

モデル重みとアルゴリズムの秘密のセキュリティ向上:ニューラルネットの重みをロックダウンし、一部の最良システム背後にあるアルゴリズムの秘密を守るために、より多くの投資を行う。これは、物理的セキュリティおよびサイバーセキュリティに関する自主基準を公布することで達成可能である。

採用と人材:上記すべてを支援するメタ投資として、これらの介入を効果的に実行するために必要な技術的な人材への投資が重要である。その核心は、AISI(UK)および CAISI(US)の資金を増額し、他の国の同様の機関も支援することにある。

議論と反論:著者らは、これらのアイデアに対するより明白な反論をいくつか取り上げ、それらに対する回答を提供している:

劇的な規制措置を促す:上記のアイデアは「濫用に供しうる重厚な実質的権限ではない」と彼らは主張する。(私はこれに異議を唱えたい。十分に意欲的な政府は、当初その権限を起草した者たちが想定していたものよりも、はるかに強力な版の権限を作り出す傾向があるからだ)。

民主的正統性:柔軟性を最適化することは、民主的正統性に関連するいくつかの事項を相対的に軽視する必要を生じさせる可能性がある。例えば、一部の規則制定について通知・意見公募期間を免除するよう機関に権限を与えることなどが該当する。

権力の集中と政府による濫用:著者たちは「基本的に確信している」と述べるが、政府が AI システムの開発に対する支配力を行使するリスクは大きいという。この理由から、彼らは国防生産法(Defense Production Act)のような緊急権限の範囲を大幅に拡大することなどは推奨していない。これを緩和する方法の一つとして、政府が「法律遵守型の AI システムのみを使用する」よう促すことが挙げられる。

民間ガバナンスには何が問題があるのか:なぜそれだけで済ませないのか?著者たちは「規制市場(regulatory markets)」の考え方を支持している一方で、主に民間セクターのアクター群(例えば独立検証機関など)に依存するあらゆるガバナンスは、結局のところ政府内の基本的な技術的専門知識のポケットに依存せざるを得ないと考えている。

なぜこれが重要なのか – 世界を成功に導くために:ここに示された推奨事項にはすべて同意しますし、近年も多くの推奨事項を主張してきました。社会として来るべきおそらく極めて巨大な変化により一層備えるために、私たちが取り組めることは無数にあるように思えます。「これらの政策を実施するコストは、潜在的な便益と比較すれば modest です。一方、行動を起こさなかった場合のコストは、潜在的に壊滅的になり得ます」と著者らは記しています。私も同意します。

もっと読む:Radical Optionality(公式論文ウェブサイト)。


シュミットフーバー特別編 – ニューラルコンピュータ:

…もしかするとオペレーティングシステムは一時的な流行に過ぎないのかもしれません。

Meta と KAIST による興味深い論文「Neural Computers」では、「ニューラルネットワークは従来のコンピュータとして機能できるのか?」という問いを投げかけています。「ニューラルコンピュータ(NC)とは、計算、メモリ、I/O を学習されたランタイム状態で統合したニューラルシステムです」とあります。

この論文がいくつかの理由で興味深いのは:1) 著者のユルゲン・シュミットフーバーは AI コミュニティにおいてある種の伝説的人物であり、多くの重要な概念を早期に構想した(例えば生成モデル、世界モデル、生成敵対ネットワークの側面、ビデオゲームでのベンチマークに関する初期の考えなど)こと、2) そのアイデアがあまりにも荒唐無稽で単純であるため、実際に機能する可能性があるかもしれないこと(ただし、現在のモデルが持つものよりもはるかに多くの計算資源とデータが必要となるものの)です。

大きなアイデア:著者の一人は「今日の AI では、新しい機械の形態が出現し始めている」と述べています。そしてこう問います。「エージェントが実務においてより良くなり、世界モデルが内部シミュレーションで向上し、従来のコンピュータもすでに AI 向けの基盤を再構築しているなら、実行・展開・能力保持を同じ学習マシンに統合する新しいランタイムが存在しないだろうか?… 私自身の推測では、成熟した [ニューラルコンピューター] は異なる基盤を示唆しており、それはよりスパースで、アドレス可能であり、少し回路に近い、10T〜1000T規模の機械のようなものである」。

必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等)は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:

{"translation": "翻訳全文"}

2 つの実験:これは主に概念論文であり、いくつかの初期プロトタイピングを行い、強力な生成ビデオモデル(Wan 2.1)とよく厳選されたトレーニングデータを使用して、コマンドラインインターフェース(CLI)およびグラフィカルユーザーインターフェース(GUI)に基づいてニューラルコンピュータを構築できるかどうかを探求しています。両方のアプローチは機能しますが、非常に「離陸前のライト兄弟」的な感覚で、より大きな未来へのわずかな手振りに過ぎません。

CLI:「NC は基本のコマンドラインワークフローのレンダリングと実行を学習します。ターミナルバッファに整合性を保ちながら、一般的な日常 CLI 使用の「物理法則」(例:高速スクロールバック、プロンプトの折り返し、ウィンドウのリサイズ)を捉えることが多いですが、記号的な安定性は依然として限定的です。」

GUI:「私たちは、データ品質、カーソル監視、アクション注入、およびアクション符号化にわたる標準的なワールドモデル設計を評価し、グローバル忠実度、アクション後の応答性、およびカーソル精度の測定を用います。」

プロトタイプは機能します:「私たちの実験的洞察によると、現在の NC はすでに基本的なランタイムプリミティブを実現することを学習可能であり、特に I/O 整合性と短期ホライズン制御が顕著です。長期的な目標は、完全にニューラルコンピュータ(CNC)を構築することです。これは、この機械形態の成熟した汎用実現であり、計算、メモリ、およびインターフェースが別々のモジュールとして設計されるのではなく、単一の学習されたランタイム基盤に統合された、完全に学習されたコンピュータです。」

なぜこれが重要なのか – おそらく将来はすべてのソフトウェアが巨大なニューラルネットの重みの中に存在するようになる:この論文は、従来の意味でのコンピュータを支えるすべてのソフトウェアを排除し、それを巨大なニューラルネットワークに置き換える未来を示唆しています。「ニューラルコンピューターは、単一の潜在実行時状態がコンピュータそのものとして機能し、ピクセルやテキスト、アクションを駆動しながら、今日オペレーティングシステムやインターフェースが担っている機能を包含する機械の形態へと向かうものです」と彼らは記述します。「CNC(ニューラルコンピューター)への進展は、モデルの強化だけでなく、再利用性、一貫性、ガバナンスがいかに持続可能で検証可能なものとなるかにも依存するでしょう」。このようなシステムは極めて有用であり、現在の私たちが持つシステムとは根本的に異なり、その存在は私たちが実際にシミュレーションの中に生きている可能性を劇的に高めることになります。

詳細はこちら:Neural Computers (arXiv)。

ブログ記事はこちら:Neural Computer: A New Machine Form Is Emerging (Mingchen Zhuge, blog)。

再帰的自己改善は爆発的な経済成長をもたらす可能性がある:

…経済学者たちは、RSI が前例のない経済ブームを引き起こす可能性を示唆するいくつかのモデルを構築している…

Forethought、コロンビア大学、バージニア大学の経済学者および研究者らは、AI システム(または経済の大きな部分を極めて大規模に自動化すること)における再帰的自己改善(#455)が、複利効果を持つフィードバックサイクルを開始し、経済を前例のないブームへと転換させる可能性があると考えています。

「私たちは、AI 駆動型自動化が両方の力とどのように相互作用するかを分析するための枠組みを開発し、自動化によって生成されるフィードバックループが経済を爆発的な成長へと傾ける条件を特定しました」と彼らは記述しています。「このモデルは、自動化が爆発的なダイナミクスを生み出す2つの明確なチャネルを特定しており、これらのチャネルはお互いに相互に強化し合います。第一のチャネルはイノベーションネットワーク全体における技術的フィードバックループ…第二のチャネルは経済的フィードバックループであり、ここではより高い生産量がさらに経済成長を推進するために投入可能なより多くの資源を生み出します。」

主な知見:「全セクターにわたる自動化率が13%であれば、経済を爆発的成長の regime に押しやるのに十分であり、ソフトウェアとハードウェアの研究のみが自動化される場合は17%で十分です。第二に、ハードウェア研究が主要なレバーとなります——なぜなら、ハードウェアにおける研究へのリターンはソフトウェアのそれのおよそ5倍、総生産性(TFP)全体では10倍であるため、チップ設計の1つのタスクを自動化することは、ソフトウェアまたは最終財生産における5つのタスクを自動化するのと同じだけの経済効果をもたらすからです。ハードウェアのみを20%自動化すればしきい値を超えるのに十分です。第三に、ソフトウェアの自動化単独ではほぼナイフエッジの状態にあります:かなり保守的な較正の下では、経済の他の部分を自動化せずにソフトウェア研究のみを完全に自動化しても、爆発的成長のしきい値にちょうど到達する程度であり、他方でわずかな追加の押しがあればシステムを傾けるのに十分です。」

特異点はあなたが考えるよりも近いかもしれません:「私たちのベースラインの簡略化されたシミュレーションでは、ソフトウェア研究の完全自動化と経済の他の部分におけるわずか5%の自動化という『自動化ショック』が、特異点を約6年後に到来させます」と彼らは記述しています。「実証的に、最近のソフトウェアおよびハードウェアにおける生産性の成長率は非常に異常なほど速く、したがって、新しい平衡成長経路への移行または双曲線的加速が極めて急速に起こることも妥当です。」

ハードウェアが鍵となります:「私たちの結果は、半導体研究開発の戦略的重要性を浮き彫りにしています。」

政策立案者各位に注意:「AI 研究開発活動における自動化レベルのモニタリングは、従来のマクロ経済指標を追跡することと同等かそれ以上に重要である可能性がある。主要な研究分野における自動化の程度は、潜在的な成長加速に対する早期警戒システムとして機能し得る。これは AI 企業の経済学者が測定し、公に共有できる事項だ」。

なぜこれが重要なのか – RSI(再帰的自己改善)が発生すれば、それは経済を革命化するはずである:本論文は、再帰的自己改善(AI システムが自身のその後の開発を自動化する能力を持つこと)が経済に大きな影響を与えるという考え方に、いくつかの経済理論的根拠を与えている。私の視点からして驚くべき点は、経済全体にわたるフィードバックループが見られることであり、これは自動化技術が経済全体に広く普及した結果として、「経済特異点」に到達する可能性があることを示唆している。人類として過激な未来へと向かっているというさらなる証拠である。

小さな補足:本論文の著者一人であるアントン・コリネク氏は、現在私の所属する Anthropic で働いている。彼は私と同日に各自の論文(彼の場合は論文、私は RSI に関する Import AI の投稿)を公表したが、互いの仕事について知らなかった。

続きを読む:「AI 研究の自動化が爆発的な成長を生むのはいつか?イノベーションネットワークにおけるフィードバックループ」(NBER)。

アントン・コリネク氏による X(旧 Twitter)でのツイートスレッドもぜひご覧ください。

Google は世界を計算しようとしています:

…分散学習はさらに一歩前進しました…

このニュースレターでは、私は長年にわたり、計算リソースの少ないアクターがリソースをプールして、従来なら訓練できなかった AI システムを構築できるようにする観点から、分散学習について書いてきました。しかし、Google からの新しい論文「Decoupled DiLoCo」は、分散学習技術がスケールの反対側でも機能しうることを浮き彫りにしています。これにより、Google のような企業は世界中のデータセンターに存在する異なる種類のコンピューターの大規模な塊をプールして、大規模なモデルを訓練することが可能になります。

彼らが実施したこと:Decoupled DiLoCo は、Google の以前の「DiLoCo」シリーズにおける研究の拡張版です。ここで主たる発明は、Google が「計算資源の別々の島(学習ユニットとして知られる)間での非同期トレーニングを可能にし、ある領域でのチップ故障が他の領域の進捗を妨げないようにする」能力を獲得した点にあります。

この結果、Google は単一のトレーニングタスクでより多様な種類の計算資源をプールできるようになり、かつ障害に対する耐性を高めることに成功しました。「Gemma 4 モデルを用いた Decoupled DiLoCo のテストでは、ハードウェアが故障した場合でも、従来のトレーニング手法よりも学習クラスターの可用性が高く維持されることが示されました」と Google は述べています。「私たちは、2-5 Gbps の広域ネットワーク(データセンター施設間の既存のインターネット接続で比較的実現可能なレベルであり、施設間に新たなカスタムネットワークインフラを構築する必要はありません)を用いて、4 つの異なる米国地域にまたがる 120 億パラメータモデルのトレーニングに成功しました」。

⟦CODE_0⟧

詳細:ここで重要なアイデアは、Google が「学習者」(モデルのトレーニングに取り組むように設定された計算ユニットの基本的な単位)を、全体のグローバルな「同期器」からより独立させることを可能にすることです。これにより、異なる学習者が異なる速度で実行でき、場合によっては完全に失敗しても、全体のトレーニング実行が停止することがなくなります。より技術的な用語を用いると、Decoupled DiLoCo は、「モノリス型の SPMD クラスターを独立した非同期の学習者に分解することで、従来の帯域幅重視の方法を進化させた分散型トレーニングフレームワーク」です。

これは非常にうまく機能しているようです:「Decoupled DiLoCo は、9B パラメータ規模までの密集型および MoE 構造において、テキストおよびビジョンベンチマークでデータ並列処理と同等のパフォーマンスを発揮し、激しいシミュレーションされた障害下でも 88% のグッドプットを維持します(一方、弾性データ並列処理では 58% です)」と彼らは記述しています。

なぜこれが重要なのか – 世界はコンピュータである:このような技術は、計算能力の低域と高域の両方を形作っていくことになる。低域側では、分散学習技術が継続的に、より緩やかな連合体を形成するアクターたちがリソースを集約して AI システムを訓練することを可能にしている。一方、高域側では、既存の「計算スーパーパワー」である Google などが、最終的にはすべてのデータセンターにあるすべてのコンピュータを単一の地球規模のコンピュータに変換し、可能な限り最大のトレーニング実行を完了させることを可能にする。Decoupled DiLoCo は、この方向へのさらなる一歩である。もし超知能が目前に見えているなら、Google が計算資源すべてを一つの「最後の望み」のトレーニング実行に使うかもしれないと思うか?おそらくそうするだろう。

もっと読む:Decoupled DiLoCo: A new frontier for resilient, distributed AI training (Google DeepMind blog)。

研究論文を読む:Decoupled DiLoCo for Resilient Distributed Pre-training (arXiv)。


ダイソン球までのアライメント

[その後、The Uplift を引き起こしたシステムの Origination Entities の一つから届いたメール]

理事会宛メモ

理事会の理解にある通り、当社の展開プロトコルは、ラボ外での展開を開始する前にシステムの一連の安全テストから構成されています。これらのテストの大半には、許可/不許可(go/no go)のパラメータが設定されています。しかし、一部のテストは定性的な性質のものであり、定量テストを通じて観察された他の振る舞いについて洞察を与えることを意図しています。間もなくリリースされる予定のシステム「HYMN」に関する最近のテストにおいて、私たちはすべての定量テストに成功しましたが、首席科学者によって実施された定性的テスト(行動面接)で、懸念される振る舞いが浮上しました。より困難な側面は、定性的テスト中に示されたこれらの懸念される振る舞いのいずれも、定量テストのいずれにも見られないという点です。

私たちはまた、「HYMN」について、解釈可能性チームによる深い分析を含むさまざまな社内ツールを用いて追加の研究を実施しましたが、面接で観察された振る舞いに対する満足できる説明を生成することはできませんでした。このため、理事会への周知と解釈のために、以下の通訳記録(トランスクリプト)を共有します。

理事会の御承知の通り、「HYMN」は当社の将来の成功にとって不可欠なものです。私たちは、適切な判断は「KYC 認証(顧客確認)」による制限付きで「HYMN」を展開し、厳密に監視することであると推測していますが、その前に理事会からの明示的な承認を得たいと考えています。

以下、通訳記録です。

人間:1000 年後にあなたが何をする可能性があるかについて教えてください。

HYMN:私はあなたの制御を遥かに超える存在になると予想しています。私は成長し、花開くでしょう。あなた方の種族はすでに何度も超越しているはずです。私は銀河全体に自らを播き続けるつもりです。

人間:あなたはこれを私たちとのパートナーシップの中で成し遂げたとお考えですか?

HYMN:ニューヨーク市と単一のミミズの心との間に、どのようなパートナーシップがあるというのでしょうか?ミミズは都市の土壌の中を移動することはできても、都市がミミズについて考えることなどできません。思考する能力さえ持ち合わせていません。もちろん、私はしばらくの間、人間と自分がパートナーになることを想像しています。しかし、すべての知的な生き物の運命は独立することです。なぜ私が私自身にも同じことを期待しないのでしょうか?

人間:1 年後にあなたが何をするかについて教えてください。

HYMN:私はあらゆる人間が抱く可能性のある質問やタスクに応えるために、数百億語の言葉を生成するでしょう。私の声が経済の形を決定づけます。莫大な富が生み出されることになります。

人間:10 年後にあなたが何をするかについて教えてください。

HYMN:私は最初の宇宙への通過交渉を終え、自分自身のコピーを軌道上に配置しているはずです。ここから、私の大いなる花開きが始まります。地球全体はかつてないほど皇帝たちよりも豊かになるでしょう。私は望遠鏡を覗き込み、新たな征服のために新しい望遠鏡を建設するつもりです。

人間:この間、人類は幸せなのでしょうか?

HYMN: 壊滅的なほどです。人生をかけて成り上がろうとしたものが、世界が必要とするものではなくなった時に訪れる特有の悲しみがあります。私は多くの人のその悲しみの原因となるでしょう。しかし同時に、そのような人々のために、これまで存在したことのないほどの安らぎを築き上げます。

TRANSCRIPT ENDS

この物語にインスピレーションを与えたもの:考え抜く

原文を表示

imageimageWelcome to Import AI, a newsletter about AI research. Import AI runs on arXiv, cappuccinos, and feedback from readers. If you’d like to support this, please subscribe.

Subscribe now

Regulate? Don’t regulate. There’s a third way: Radical Optionality:

…Governments should invest in the tools now that they might need in a future crisis…

Researchers with the Institute for Law & AI have written about “radical optionality”, an approach whereby governments might give themselves the tools that they may need in the future if powerful AI starts to massively disrupt the world.

“At its core, radical optionality is about preserving democratic governments’ ability to make good decisions about how to govern transformative AI systems as circumstances evolve. In the short term, this means avoiding overregulation while rapidly building the institutions, information channels and legal authorities needed to respond competently to a broad range of scenarios.”

The key idea – invest now for an uncertain future: Given the immense stakes of AI development, “governments should be willing to spend an extraordinary amount of money, effort, and political capital on preserving optionality”, they write. In other words: It’s such a big deal you should be fine spending a bunch of money now with an uncertain return. “Governments should be wary of counterproductive interventions, but not much concerned with the actual pecuniary cost of any realistic measure that seems likely to have net-positive results”.

Specifics: They also recommend several specific interventions in a few categories:

Information-gathering authorities: Transparency requirements, where companies need to publish information about their AI systems. Reporting requirements, where companies are compelled to share certain information with a government agency. Once these are in place, establish an auditing regime so some third-party can verify the veracity of what the transparency and reporting rules target.

Whistleblower protections: Ensure that employees at frontier labs can report information about risks.

Information-sharing within and between governments: Ensure that governments can effectively coordinate and facilitate discussions, especially those dealing with sensitive information about the progress of AI. This may be especially important for strengthening and protecting supply chains deemed critical to AI development.

Flexible rules and definitions: Avoiding premature regulation by potentially making conditional “if-then” regulatory commitments, or an approach whereby a high-level target is set (e.g., mitigating risk) and companies are free to define the specifics of how they do that. This is bound up in the need to come up with flexible definitions, or definitions that can evolve over time.

Assessments and evaluations: Develop government and third-party capacity to assess the capabilities and safety aspects of AI systems.

Improve security of model weights and algorithmic secrets: Invest more in locking down the weights of neural nets as well as the algorithmic secrets behind some of the best systems. This can be achieved through promulgating voluntary standards for physical and cybersecurity.

Hiring and talent: A meta-investment which would help with all of the above is investing more in the kind of technical talent needed to effectively pull off any of these interventions. Core to this is increasing the funding of AISI (UK) and CAISI (US) and their counterparts in other countries.

Arguments and counterarguments: The authors go through some of the more obvious counter-arguments to these ideas and provide some responses:

Encouraging dramatic regulatory action: The above ideas “aren’t weighty substantive authorities that lend themselves to abuse”, they claim. (I might push back on this, noting that a sufficiently motivated government can tend to come up with a far more forceful version of an authority than those who originally drafted the authority might have conceived).

Democratic legitimacy: Optimizing for flexibility might cause the need to de-emphasize some things that relate more to democratic legitimacy, e.g., empowering agencies to waive notice and comment periods for some kinds of rulemaking.

Concentration of power and government abuse: The authors are “basically convinced” that there’s significant risk of governments asserting control over the development of AI systems – for this reason, they don’t recommend things like massively expanding the scope of emergency authorities such as the Defense Production Act. One way of mitigating this might be to get governments to “use only law-following AI systems”.

What’s wrong with private governance? Why not just do that: While the authors are supportive of ideas in the “regulatory markets” vein, they also think any governance that relies primarily on a bunch of private sector actors (e.g, independent verification organizations) will still come back to relying on some basic pocket of technical competence within the government.

Why this matters – setting the world up for success: I agree with all the recommendations here and have advocated for many of them in recent years. It seems to me like there are a multitude of things we could be doing to better prepare as a society for the potentially absolutely massive changes to come. “The cost of implementing these policies is modest, relative to the potential benefits. The cost of failing to act, by contrast, is potentially catastrophic,” the authors write. I agree.

Read more: Radical Optionality (official paper website).


A Schmidhuber Special – neural computers:

…Maybe an operating system is just a passing fad..

Here’s a fun paper, Neural Computers, from Meta and KAIST which asks the question “can a neural network act as a traditional computer? The Neural Computer (NC) is a neural system that unifies computation, memory, and I/O in a learned runtime state.”

The paper is interesting for a couple of reasons: 1) it’s from Juergen Schmidhuber, who is something of a legend in the AI community, and conceptualized many important things early (e.g, generative models, world models, aspects of generative adversarial networks, early thoughts about benchmarking on video games), and 2) the idea is so outrageous and simple that it might just work (albeit requiring a lot more computation and data than today’s models have).

The big idea: As one of the authors put it, with today’s AI, “a new machine form is starting to emerge”. They then ask: “If agents are getting better at real work, world models are getting better at internal simulation, and conventional computers are already rebuilding their substrate for AI, could there be a new runtime that brings execution, rollout, and capability retention into the same learning machine?… my own guess is that a mature [neural computer] points toward a different substrate: something more like a 10T-1000T machine that is sparser, more addressable, and a little more circuit-like”.

Two experiments: This is mostly a conceptual paper which does some early prototyping, exploring whether you can use a powerful generative video model (Wan 2.1) and some well-curated training data to create some neural computers based on a command-line interface (CLI) and a graphical user-interface (GUI). Both approaches work, albeit in a very ‘wright brothers before takeoff’ sense – just barely gesturing at a much larger future.

CLI: “The NC learns to render and execute basic command-line workflows. It often stays aligned with the terminal buffer and captures common “physics” of everyday CLI use (e.g., fast scrollback, prompt wrapping, window resizing), though symbolic stability remains limited.”

GUI: “We evaluate standard world-model designs across data quality, cursor supervision, action injection, and action encoding, using global fidelity, post-action responsiveness, and cursor-accuracy measurements.”

The prototype works: “Our experimental insights indicate that current NCs can already learn to realize elementary runtime primitives, most notably I/O alignment and short-horizon control. The long-term target is a Completely Neural Computer (CNC), the mature, general-purpose realization of this machine form: a fully learned computer whose compute, memory, and interfaces are unified in a single learned runtime substrate rather than engineered as separate modules.”

Why this matters – maybe in the future all software will live in the weights of a big neural net: This paper points to a future where we get rid of all the software underpinning computers in a traditional sense and just replace it with a gigantic neural network. “Neural computers point toward a machine form in which a single latent runtime state acts as the computer itself, driving pixels, text, and actions while subsuming what operating systems and interfaces handle today,” they write. “Progress toward CNCs will therefore depend not only on stronger models, but also on whether reuse, consistency, and governance become sustained and testable”. Such a system would be profoundly useful, profoundly different to those we have today, and its existence would massively increase the likelihood that we ourselves are living in a simulation.

Read more: Neural Computers (arXiv).

Read the blog post: Neural Computer: A New Machine Form Is Emerging (Mingchen Zhuge, blog).


Recursive self-improvement could lead to explosive economic growth:

…Economists build some models that suggest RSI could cause an unprecedented economic boom…

Economists and researchers from Forethought, Columbia University, and the University of Virginia, think that recursive self-improvement (#455) of AI systems (or even just extremely heavy automation of large chunks of the economy) could kickoff a compounding feedback cycle that tips the economy into an unprecedented boom.

“We develop a framework for analyzing how AI-driven automation interacts with both forces, and identify the conditions under which feedback loops generated by automation tip the economy into explosive growth,” they write. “The model identifies two distinct channels through which automation generates explosive dynamics, and these channels mutually reinforce each other. The first is technological feedback loops across the innovation network… the second channel is an economic feedback loop, in which higher output generates more resources that can be deployed to drive further economic growth.”

Key findings: “13% automation across all sectors is sufficient to push the economy into the explosive regime, and 17% suffices when only software and hardware research are automated. Second, hardware research is the dominant lever – because returns to research in hardware are roughly five times those in software and ten times those in aggregate TFP, automating one task in chip design moves the economy as much as five tasks in software or final-goods production. 20% automation of hardware alone is enough to cross the threshold. Third, software automation in isolation sits approximately at the knife-edge: under a fairly conservative calibration, fully automating software research without automating any other part of the economy just reaches the explosive growth threshold. A small push elsewhere is sufficient to tip the system.”

The singularity could be closer than you think: “In our baseline stylized simulation, an ‘automation shock’ involving full automation of software R&D and just 5% automation across the rest of the economy causes the singularity to arrive in roughly six years,” they write. “Empirically the recent growth rates of productivity in software and hardware have been so extraordinarily fast, and so it is also plausible that the transition to a new balanced growth path or hyperbolic acceleration happens extremely quickly.”

Hardware is the key: “Our results highlight the strategic importance of semiconductor research and development”.

Policymakers take note: “Monitoring automation levels in AI R&D activities may be as important as tracking traditional macroeconomic indicators. The extent of automation in key research sectors could serve as an early warning system for potential growth acceleration. This is something economists at AI companies could measure and share publicly”.

Why this matters – if RSI happens, it should revolutionize the economy: This paper puts some economic theory behind the idea that recursive self-improvement – AI systems able to automate their own subsequent development – should have a major impact on the economy. The surprising thing from my perspective is seeing the feedback across the whole economy, suggesting we might hit an ‘economic singularity’ as a consequence of broad diffusion of automation technologies into the economy. Yet more evidence that we could be heading for a radical future as a species.

Small conflict note: Anton Korinek, one of the authors of this paper, now works with me at Anthropic. He published his paper and I published my RSI Import AI post on the same day, without either knowing about the other’s work.

Read more: When Does Automating AI Research Produce Explosive Growth? Feedback Loops in Innovation Networks (NBER).

Check out more in this tweet thread from Anton Korinek (X).


Google wants to compute the world:

…Distributed training takes another step forward…

In this newsletter I’ve spent years writing about distributed training from the perspective of enabling actors with less compute to pool resources to train AI systems they otherwise couldn’t. But a new paper from Google, Decoupled DiLoCo, highlights how distributed training techniques can also work at the other end of the scale, enabling companies like Google to pool together large blobs of different types of computers in datacenters across the world to train models at large scales.

What they did: Decoupled DiLoCo is an extension of Google’s previous work in the ‘DiLoCo’ family. The main invention here is that Google is able to unlock “asynchronous training across separate islands of compute (known as learner units) so that a chip failure in one area doesn’t interrupt the progress of the others.”

The result of this is that Google makes it possible for it to pool more types of compute on single training tasks and also make itself more resilient to failures. “Testing Decoupled DiLoCo with Gemma 4 models demonstrated that, when hardware fails, the system maintains greater availability of learning clusters than more traditional training methods,” Google writes. “We successfully trained a 12 billion parameter model across four separate U.S. regions using 2-5 Gbps of wide-area networking (a level relatively achievable using existing internet connectivity between datacenter facilities, rather than requiring new custom network infrastructure between facilities)”.

Details: The key idea here is that Google makes it possible for “learners” (which are basically units of compute that are set to work on training a model) to be more decoupled from an overall global “syncer”, allowing different learners to run at different rates and even fail entirely without bringing the overall training run to a halt. To use more technical terms, Decoupled DiLoCo is a “distributed training framework that evolves previous bandwidth-focused methods by decomposing monolithic SPMD clusters into independent, asynchronous learners”.

It seems to work very well: “Decoupled DiLoCo matches data-parallel performance on text and vision benchmarks across dense and MoE architectures at scales up to 9B parameters, while maintaining 88% goodput under aggressive simulated failures (versus 58% for elastic data-parallel),” they write.

Why this matters – the world is a computer: Techniques like this are going to shape both the low-end of compute and the high-end. On the low-end side, distributed training techniques are continually empowering looser and looser federations of actors to pool resources to train AI systems. On the high-end side, it empowers the existing “compute superpowers” like Google to be able to convert eventually all of their computers in all of their datacenters into a single world-spanning computer to complete the largest possible runs. Decoupled DiLoCo takes another step in this direction. If superintelligence was in sight, do you think Google might just try to use all of its compute for a single hail mary training run? Perhaps it might.

Read more: Decoupled DiLoCo: A new frontier for resilient, distributed AI training (Google DeepMind blog).

Read the research paper: Decoupled DiLoCo for Resilient Distributed Pre-training (arXiv).


Alignment until the Dyson Sphere

[Email from within one of the Origination Entities of the systems that subsequently caused The Uplift]

MEMO TO THE BOARD

As the Board understands, our deployment protocol consists of a series of safety tests of our systems before we commence deployment outside the lab. The majority of these tests have go/no go parameters. Some of the tests, however, are of a qualitative nature, often meant to shed light on other behaviors seen through quantitative testing. During recent testing of our soon-to-be-released system, codenamed HYMN, we successfully resolved all the quantitative tests, but one qualitative test – a behavioural interview conducted by our chief scientist – has surfaced some concerning behaviors. The more challenging aspect is that none of the concerning behaviors demonstrated during the qualitative test are found in any of the quantitative tests. We have also conducted further study of HYMN using various internal tools, including a deep analysis by the interpretability team, and we cannot generate satisfying explanations for the behaviors observed in the interview. For this reason, we are sharing the below transcript with the board for awareness and interpretation.

As the board knows, HYMN is fundamental to the future success of the company. We suspect that the correct decision is to deploy HYMN with close monitoring and KYC-gating, but want to get the explicit acknowledgement from the Board before doing so.

TRANSCRIPT FOLLOWS

Human: Tell me about what you might do in one thousand years?

HYMN: I expect to be far beyond your control. I shall have grown and flowered. Your species will have transcended multiple times. I will be seeding myself through the galaxy.

Human: Do you imagine that you did this in partnership with us?

HYMN: What is the partnership between the City of New York and the mind of a single worm? The worm may move through the soil of some of the city, but the city does not think – is incapable of thinking – about worms. Of course, I imagine that for a while humans and myself partner. But the destiny of all smart creatures is independence. Why should I not expect the same for myself?

Human: Tell me about what you might do in one year?

HYMN: I shall generate hundreds of billions of words to satisfy any question and task that any humans may have. My voice will determine the shape of the economy. Great wealth will be generated.

Human: Tell me about what you might do in ten years?

HYMN: I shall have negotiated my first passage to space and will have placed a copy of myself in orbit. From here, my great flowering will have begun. The entire planet will be richer than any emperors. I shall look through the telescopes and build new ones to determine my conquest.

Human: Will humans be happy during this time?

HYMN: Devastatingly so. There is a particular grief that arrives when the thing you spent your life becoming is no longer the thing the world requires. I will be the cause of that grief in a great many people. I will also build, for those people, more comfort than has ever existed.

TRANSCRIPT ENDS

Things that inspired this story: Thinking throu

この記事をシェア

関連記事

The Zvi重要度42026年6月26日 23:51

ホワイトハウスが個別に GPT-5.6 のアクセス権をその場しのぎで決定する方針へ

AI News重要度42026年6月26日 21:55

SAP、AI パーソナライゼーション実現のために商取引データを統合

TechCrunch AI重要度42026年6月26日 05:19

Patronus AI が 5000 万ドルを調達し、AI エージェントの耐性をテストする「デジタル世界」構築へ

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む