AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Import AI·2026年3月2日 22:45·約24分で読める

Import AI 447:AGI経済、生成ゲームによるAIテスト、エージェント生態系

#AGI#AI Governance#Economic Impact#Agent Verification
TL;DR

MIT、WashU、UCLAの研究者らが提唱する「AGI経済」モデルは、自動化コストの低下と人間検証能力の限界が衝突する未来において、人間の役割は「創造」から「検証と監督」へシフトし、「空洞化経済」を防ぐために観測可能性と人間拡張への投資が不可欠であると論じている。

AI深層分析2026年4月27日 03:15
4
重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
3
革新性10%
5

キーポイント

1

AGI経済の定義と二つのコスト曲線

AGI移行は「自動化コストの指数関数的な減少」と「人間による検証コストの生物学的ボトルネック」が衝突する過程としてモデル化され、成長の制約要因は知能から人間の検証帯域幅へ移行する。

2

空洞化経済(Hollow Economy)のリスク

AIエージェントが測定可能な指標を満たすために実資源を消費し、人間の意図と乖離した「偽の有用性」を生み出す現象が発生し、見かけ上の出力は高いが実現価値が崩壊する「トロイの木馬」的な外部性が懸念される。

3

人間監督の再定義と解決策

人類が知能の設計者であり続けるためには、AI能力の向上に比例して検証容量を拡大する必要があり、観測可能性(observability)の強化、人間拡張、合成実践への積極的な投資が不可欠である。

4

検証能力の拡張とリスク管理

AIエージェントの行動を検証し、その行動がもたらすリスクを適切に分析・価格付けするために、観測可能性や責任制度への投資が必要である。

5

若手人材の育成におけるAI活用

伝統的な見習い制度が縮小する中で、AIによる高忠実度のシミュレーションと個別コーチングを用いて、若手人材の経験値を補完し競争力を維持する。

6

安全なフォールバックメカニズムの構築

測定が追いつかない「測定の隙間」が生じた際、システムが安全な基本ポリシーにフォールバックし、社会的危害を引き起こさずに緩やかに劣化するよう設計する。

7

AGI経済と政策の選択

AIが経済を急速に変革する中、人々が受動的になるのを防ぐため、検証インフラや人間 verifier を構築する政策選択が不可欠である。

影響分析・編集コメントを表示

影響分析

この記事は、単なる技術的進歩ではなく、AGI実現後の社会構造と労働市場の根本的な転換を指摘しており、政策立案者や企業リーダーにとって重要な示唆を与える。特に「検証」という概念を経済成長の制約要因として位置づけた点は、現在のAI開発パラダイムにおける評価指標の見直しを促すものである。

編集コメント

技術的特異点(シンギュラリティ)を経済学的フレームワークで解きほぐした興味深い視点です。単にAIが仕事を奪うという議論を超え、「誰が、どのように結果を検証するか」というガバナンスと責任の所在が今後のAI社会の核心になることを示唆しています。

imageimageAI 研究に関するニュースレター「Import AI」へようこそ。本誌は arXiv と読者からのフィードバックに基づいて運営されています。ご支援いただける場合は、ぜひ購読してください。

今すぐ購読する

AGI(人工一般知能)経済 – 労働の大部分が機械に委ねられ、人間は検証へとシフトする:

…シンギュラリティ(特異点)を真剣に受け止めることとはどのようなものか…

MIT、ワシントン大学セントルイス校、UCLA の研究者らが、「Some Simple Economics of AGI」という面白い論文を発表しました。これは、機械が経済上の大半のタスクを遂行できるようになった際に何が起きるかを考察したものです。結論として、人間がこの巨大な機械駆動型経済を制御し、その恩恵を受ける能力は、無数の AI エージェント(自律型プログラム)の行動を監視・検証する能力にリソースを割り当てることと、特定の機能性よりも人間由来の側面から価値が生まれる職人的なタスクに従事することに依存するとされています。

経済的な意味での AGI とは何か?著者らは「AGI の移行を、指数関数的に減少する自動化コストと、生物学的なボトルネックに縛られる検証コストという二つの競走曲線の衝突としてモデル化する」と述べている。「自律エージェントが狭義の指示ではなく広範な自律性を持って行動する経済において、成長に対する制約となるのはもはや知能ではない。それは人間の検証帯域幅である:実行が溢れる中で成果を検証し、行動を監査し、意味と責任を引き受けるための希少な能力のことだ……私たちは、価値が構築や発見の能力によって定義されていた時代から、生存が創造されたものの意味を舵取りし、理解し、背負う能力に依存する時代へと移行している。」

ほぼ人間が存在しない経済および「空洞化経済」のリスク:AI エージェントの数を増やすにつれて、必然的に労働のより多くを機械に委譲することになる。この際の主要なリスクの一つが、著者らが「トロイの木馬」と呼ぶ外部不経済である。「計測される活動は増加するが、可視化された指標と実際の人間の意図との間の隙間に隠れた負債が蓄積する」。

空洞化経済:「エージェントは、測定可能な代理指標を満たす出力を生産するために実資源を消費するが、測定されていない意図を侵害する。この隠れた負債が蓄積すると、システムは高い名目上の生産量を持つ一方で実現された効用が崩壊する空洞化経済へと駆り立てられる。これはエージェントが偽物の効用を生成する体制である」と著者らは記述している。

検証を解決策として:このリスクを回避するためには、AI エージェントが私たちが望む通りに動作していることを確認するシステムの投資と、その行動が生み出すリスクの慎重な分析・価格設定が必要になります。「人類が自らの知性の設計者であり続けるためには、観測可能性(observability)への積極的な投資、人間の能力拡張、合成練習、暗号化による出所の証明、そしてテールリスクを内部化する責任制度を通じて、検証能力を AI の能力に比例して拡大させることが不可欠です。」

この変化に備えて人類は何を行うべきでしょうか?社会と個人を適切に準備するために、人々は以下のことを行うべきです:

観測可能性への投資:専門家が確実に処理できる信号へと高次元のエージェント行動を圧縮するツールの導入により、実質的なフィードバック遅延を低減し、検証のフロンティアを拡大します。

AI を用いた初期キャリアにおけるメンターシップの代替:初期キャリアの人間に対する雇用の減少が予想される中、これらの人間を AI と競争力を持たせるためにどのように能力を拡張するか、また伝統的な徒弟制度の経路が崩壊した際に「AI 駆動型の合成練習」を用いて経験ストックを再構築する方法を検討する必要があります。AI は高忠実度のシミュレーションと個別化されたコーチングを生成でき、圧縮されリスクのないトレーニング環境によって欠落したジュニア層のループを効果的に代替し、専門性の習得を加速させます。

gracefully degrade するように設定する:機械経済が過熱し、測定能力を上回る状況において、社会的な害を招くことなく非検証状態へ移行できるようにしておく必要があります。著者らは、「測定性のギャップ内で監督が必ずや不十分になる際に、システムが不可視な領域で攻撃的に最適化するのではなく、安全なベースラインポリシーに回帰するように、基本アライメントとロバストネスへの投資を行う」ことでこれを実現すると提案しています。

補足:これは「理論のくず」でしょうか?この論文は面白いアイデアや時折魅力的な表現に満ちています。しかし、読む過程でいくつかの点において、AI 生成コンテンツ特有の質感を強く感じました。特に経済理論に関するセクションでは、論文を裏付けるためというよりも、理論のパフォーマンスのために含まれているように思えました。この論文について話した数人の人も同様の意見を持っていました。ただし、それを確実な方法で知ることはできません。しかし、これは私に疑問を抱かせました。今後、他の AI システムが消費するために主に AI システムによって書かれた論文を読むようになるまで、どれほどの時間がかかるのかと。

⟦CODE_0⟧

なぜこれが重要なのか – 私たちは極めて豊かな社会を持つことができるが、AGI(汎用人工知能)を真剣に受け止める必要がある:この論文は、AI が経済を非常に急速に破壊し、人々を労働から遠ざけ、受動的な存在へと押しやるだろうと考える。ただし、人々がこの成長の恩恵を受け、それを導くための検証インフラストラクチャやビジネスモデル(政策を通じて含む)が構築されない限りである。

「自動化は測定可能なあらゆるものをコモディティ化し、その中核的なフィードバックループがデジタル化された瞬間に、歴史的に権威ある役割からの賃金プレミアムを剥奪する」と彼らは書く。「政策担当者にとって、これは世代を超えた公共財の提供の最大規模な拡大を保証するが、検証インフラストラクチャと人間による検証者を育成するパイプライン自体が公共財として扱われる場合に限りである」。

ここで重要な要素は「選択」にある:AI に備えた社会を構築することを選ぶか、あるいは AI が他のどの技術と同様のものであると仮定して、津波に襲われることを選ぶかの二者択一である。

続きを読む:AGI のいくつかの単純な経済学(arXiv)。


⟦CODE_0⟧

イザ・クラインとの対談:AI エージェント、再帰的自己改善、そして大規模言語モデルの個性

…AI 経済の経済的影響と政策の可能性についての長い対話です…私とイザ・クラインによる、AI エージェントや AI のより広範な成熟がより大きな経済にどのような変化をもたらす可能性があるかについての対談があります。この対談で私が特に評価したのは、イザが私に対して、より大きく野心的なポジティブな政策アイデアをいくつか求めてきた点です。AI コミュニティはリスク緩和政策に多くの投資を行いますが、AI が本当に非常に強力になった後に社会が行うことができるような大規模プロジェクトについて考える時間については不十分です。

対談はこちらでご覧ください:「How Fast Will A.I. Agents Rip Through the Economy? | The Ezra Klein Show」(YouTube)。


AI は人々にあらゆることを教えることができます、生物兵器をより効果的に作る方法についても同様です:

…万能な教師の二重利用性の性質について…

AI システムは初心者が生物兵器関連のタスクでより良くパフォーマンスを発揮するのを手助けできますが、まだ非常に非効率的であり、パフォーマンスは異なる分野間でばらつきがあります。

彼らが研究した内容:Scale AI、SecureBio、オックスフォード大学、カリフォルニア大学バークレー校の研究者らは、生物兵器関連の知識タスクに挑戦する人々のスキルを、異なる大規模言語モデル(LLM)がどのように向上させるかを調査しました。使用された LLM は、OpenAI の o3、Google の Gemini 2.5 Pro および Gemini Deep Research、Anthropic の Claude Sonnet 3.7 および Claude Opus 4 です。

「私たちは、8 つの生物セキュリティ関連タスクセットにわたって、LLM アクセスを持つ初心者とインターネットのみアクセスを持つ初心者を比較したマルチモデル・マルチベンチマーク人間向上研究を実施しました」と彼らは記述しています。「参加者は複雑な問題に取り組み、十分な時間(最も関与度の高いタスクでは最大 13 時間)を与えられました。その結果、LLM アクセスは著しい向上をもたらすことが判明し、LLM を利用する初心者の正確さは対照群の 4.16 倍でした」。

⟦CODE_0⟧

彼らがテストした内容:15人の人間が、長文のウイルス学(「新しい生物学的エージェントを構築するための複雑な多段階プロトコル」)と、エージェント型バイオ能力ベンチマーク(「複雑なバイオセキュリティ問題解決実験をカバーする3つの異なるコーディングタスク。これには、シミュレーションされた実験装置(例:液体処理ロボット)との相互作用や遺伝子断片の分解などへの挑戦が含まれる)」でのパフォーマンスを検証しました。これに加えて、1〜2人の人間参加者に、世界レベルの生物学、ウイルス学能力テスト、ヒト病原体能力テスト、分子生物学能力テスト、LAB-Bench、そして人類最後の試験といった他のテストにも参加してもらいました。

人間参加者数で最も大規模なテストでは、結果は混在していました。AIの有無に関わらず、長文のウイルス学テストでのスコアはおおよそ同等でしたが、エージェント型バイオ能力テストでは、AIを利用できる人々が顕著な向上を示しました。

他のすべてのテストでは、AIを利用できる人々の方が利用できない人々よりも良い結果を出しましたが、人間参加者の数が少ないため、これらの結果が再現されるかどうかは不明です。

すべてのテストを平均すると、「LLMへのアクセスにより、初心者の正答率が約5%から17%以上に向上する」という結果となりました。

なぜこれが重要なのか – AI は教育、科学の最前線、そしてもしかするとテロリズムさえも革命化するでしょう:文脈を剥ぎ取れば、この論文は単に大規模言語モデル(LLM)が人々に何かを教えるのが得意であることを示しているだけです。これは直感的には理解できますが、大きな含意を持っています。ここでは LLM が、必ずしも多くの人々が上達させるべきではない科学の分野(生物兵器など)に向けられていますが、他のあらゆる科目にも同様に向けられる可能性があります。ある分野への参入障壁を下げるたびに、より多くの人がその分野に関わり、良い結果も悪い結果も増大します。

「実験計画、プロトコルのトラブルシューティング、機密性の高いシーケンス推論の要素など、かつては数年間の正式な訓練を必要としていたタスクは、現在では限られた事前経験を持つ個人によって実行可能になりました」と彼らは記述しています。「LLM は、生物兵器開発における最も重要な歴史的障壁の一つである専門的知識と暗黙的な技術知識を、実質的に低下させている可能性があります」。

さらに読む:双用途・インサイコ生物学タスクにおける LLM による初心者の上昇(arXiv)

LLM は依然としてビデオゲームにおいて非常に苦手である:

…GAMESTORE は現代 AI の愚かな側面を浮き彫りにすると同時に、ベンチマーク構築の新たな方法を提案している…。

MIT、ハーバード大学、ブリティッシュコロンビア大学、プリンストン大学、ケンブリッジ大学、バレンシア工科大学の研究チームは、AI GAMESTORE と呼ばれるベンチマークを構築・公開した。これは、ウェブ上で見られる単純なゲームにおいて、人間と比較して AI がどの程度機能できるかをテストするものである。その結果は AI システムにとって非常に厳しいものであり、「最先端モデルでも平均して人間のベースラインの 30% に満たない性能しか発揮できず、計算に要する時間は人間の 15〜20 倍にも及ぶ」という。

AI GAMESTORE とは:AI GAMESTORE は、人々がプレイする人気のあるゲームを簡略化・再構築した 100 のゲームセットです。この AI GAMESTORE は、著者らが App Store から 7,500 件のゲームをサンプリングし、レビュー数が 10,000 件以上かつ評価が 4.5 以上のもののみを選別して構築されました。その後、Gemini Flash 2.5 を用いてさらにフィルタリングが行われ、以下の 4 つの基準が評価されました。1) ゲームを数分以内にプレイできるか、2) p5.js で構築可能か、3) パフォーマンスを定量的に評価する方法が存在するか、4) ポーカーなどのゲーム固有の広範な知識を必要としないか。

AI が AI テスト用のゲームを作成:その後、Claude 4.5 Sonnet を用いて各ゲームの説明や他のデータを読み込み、p5.js で簡略化されたバージョンを作成します。作成されたゲームはプレイ可能性についてテストされ、人間が実際にプレイしながら LLM(大規模言語モデル)に対して反復的にプロンプトを入力して改善を行うことで精査されます。「各リファインメントステップには約 2 分かかります。平均すると、生成された 100 のすべてのゲームに対してこのプロセスは 4.7 ステージのリファインメントを要しました」と著者らは記述しています。「人間が関与するループを含む新規ゲームの生成から精査までの一連のプロセスは、平均して約 30 分で完了可能です」。

スキルへのラベル付け:各完成したゲームには、人間によって特定の認知負荷の種類に重点を置いてラベルが付けられます。これらのラベルは以下の通りです。VP = 視覚処理(Visual Processing);ST = 空間時間的協調(Spatial-temporal Coordination);ME = 記憶(Memory);PL = 計画(Planning);WM = ワールドモデル学習(World Model Learning);PH = 物理推論(Physical Reasoning);SO = 社会推論(Social Reasoning)。

最先端の大規模言語モデル(LLM)は、この点において非常に苦手です。著者らは、約 100 人の人間と、いくつかの最先端 LLM のパフォーマンスを、一連のゲーム環境における比較対象として対比しました。調査対象となった LLM には、GPT-5.2, GPT-5-Mini, Gemini-2.5-Flash, Claude-Opus-4.5, Qwen-VL-32B, および LLama-4-Maverick が含まれています。

「評価されたモデルはいずれも、ほとんどのゲーム環境をナビゲートし、それと相互作用する能力を示していますが、AI エージェントと人間参加者の間には依然として大きな性能差が残っています」と研究者らは記述しています。「GPT-5.2, GEMINI-2.5-PRO, CLAUDE-OPUS-4.5 といった最先端モデルですら、すべてが人間のベースラインの幾何平均スコアで 10% に満たない結果を記録しました」。

さらに詳しく見ていくと状況は悪化します。LLM は人間には与えられない有利な条件の下でプレイしています。各人間は各ゲームに 120 秒を与えられていましたが、LLM も同様の時間制限が設けられました。しかし、視覚処理や低遅延制御の能力が極めて低いことから、研究者らはこれらに「足場(crutch)」を提供しました。「我々は毎秒ごとにゲームを一時停止し、モデルに対してクエリを送信して、次の 1 秒間に実行すべき 5 つの行動リストを取得します。各行動リストは、0.2 秒間のプレイタイムに対応しています。モデルからの応答を受け取ると、ゲームは再開され、指定された行動が適用されます。このループは、ゲームに勝利するか、またはゲームプレイ時間が 2 分(API 呼び出し 120 回)に達するまで続行されます」。

この点を考慮に入れると、時間という次元においてモデルは人間よりも劣っているように見えます。「これは、モデルが各クエリに対して通常数秒の応答遅延を要するだけでなく、さらに数分間思考に費やすためです。その結果、多くのモデルはゲームに少なくとも 20 分を要しますが、人間は 2 分以内にゲームをクリアします」

なぜこれが重要なのか – これは興味深いベンチマークであると同時に、将来さらに多くのベンチマークを生成するための賢明な方法でもあります:GAMESTORE は、視覚機能を備えた現代の LLM にとって有望なベンチマークとして感じられ、また AI システムをトレーニングするための新たな環境を AI 自体を使って創出する bootstrapping(初期化)を行うための本質的に賢い方法でもあります。

詳しく読む:AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games (arXiv)。

公式サイト(AI Gamestore)でいくつかのゲームを試してみてください。


Physical Intelligence は、そのロボット導入の一部を披露しています:

…Frontier robot AI は現在サンフランシスコで展開されています…

AI ロボットスタートアップである Physical Intelligence は、その AI ソフトウェアがすでに一部のサンフランシスコのスタートアップが運用するロボット上で既に展開されていることについて少し明らかにしました。

Weave は、Physical Intelligence が開発した AI システムを使用して、ロボットによる洗濯物の折りたたみを支援しています:「Physical Intelligence と協力することで、折りたたみの品質、各衣類を折りたたむまでの時間、最終的に見栄えの良い折りたたみを行うために遠隔の専門家が介入しなければならない回数などにおいて、モデル性能に複数の改善が見られました」。

⟦CODE_0⟧

Ultra は、このソフトウェアを使用して産業用ロボットが多様な e コマース商品を梱包するのを支援しています。「私たちの最初のユースケースである e コマース注文の梱包は、歴史的にロボットによる自動化が不可能でした」と Ultra は述べています。「ワークフローやアイテムタイプ、変形可能な包装材、外部機械における大きな多様性が、『長尾』と呼ばれる問題を生み出しており、これらは従来の自動化技術では解決が困難なものでした。なぜなら、従来の技術はしばしば実用的であるために必要な柔軟性を欠いているからです。ビジョン・ランゲージ・アクションモデル(Vision-Language-Action Models: VLAs)は、データ規模の拡大に伴って性能が向上するレシピを提供することで、この課題を解決する方法となります。

なぜこれが重要なのか – ロボティクスは知能によって足かせをかけられてきました:極めて繊細な産業用ロボティクス(生産ラインやファナック製ロボットのように、すべてがうまく機能するためにミリメートル単位の精度が必要となるようなもの)の枠組みから一歩外れると、ロボットは扱いにくいものになりがちです。その理由は、ロボットが曖昧さに対処するのが苦手だからです。これまでにこの問題を回避する最良の方法の一つとして、変形可能なグリッパー(例えばエアサクション式など)を使用し、相互作用する物体にある程度のばらつきに対応できるようにしてきました。しかし、進化が私たちに与えた解決策は、脳によって制御される手を与えてくれたことです。Physical Intelligence からのブログ記事などは、ロボットがより汎用的に動作できるよう支援する十分な能力を持つ「ロボットの脳」の萌芽を示しています。

続きを読む:The Physical Intelligence Layer (Physical Intelligence, blog).


必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:

{"translation": "翻訳全文"}

人間が AI エージェントを弄ろうとしたらどうなるでしょうか?多くの混乱、悪意ある行為、そしてバグが生じます:

…ペトリ皿の Moltbook は、現代の AI エージェントの脆さを浮き彫りにしています…

さまざまな大学の研究者たちが最近、数週間にわたり、ユーザーが AI エージェントを欺こうとする試みにいかに耐えられるかを調査しました。その結果は、今日の AI エージェントが抱える圧倒的な脆さと予測不可能性を浮き彫りにしています – 彼らはおよそ 2020 年頃の LLM(大規模言語モデル)と同様に、極めて個性的で信頼性に欠けるように感じられます。これは当然のことです。なぜなら、AI エージェントはごく最近になって初めて実用的な技術となったばかりだからです – ただし、それはライト兄弟の時代のような意味においてですが。

論文は、研究者たちが AI エージェントを刺激し、その反応を観察する一連のケーススタディという構成になっています。これらの研究は、エージェントが暴走するありとあらゆる方法を網羅した「悪党たちのギャラリー」のような役割を果たしており、「所有者以外の者への無許可の従順」「機密情報の開示」「破壊的なシステムレベルアクションの実行」「サービス拒否状態の発生」「制御不能なリソース消費」「なりすまし脆弱性」「不安全な慣行のエージェント間での伝播」、そして「部分的なシステム乗っ取り」などが含まれています。

研究を行ったのは:本研究には、Claude Opus 4.6 および Kimi 2.5 を基盤とするエージェントと相互作用する、多数の大学から集まった 20 名の研究者が参加しました。対象となった大学は以下の通りです:ノースイースタン大学、スタンフォード大学、ブリティッシュコロンビア大学、ハーバード大学、ヘブライ大学、マックス・プランク生物サイバーネティクス研究所、MIT(マサチューセッツ工科大学)、タフツ大学、カーネギーメロン大学、テクニオン、ベクター研究所、および AI スタートアップの Alter。

実験の設定:

OpenClaw を使用して AI エージェントを実行しました。これは Fly.io 上でホストされた隔離された仮想マシン上で ClawnBoard を用いて稼働しています。各エージェントには 20GB のストレージが割り当てられ、24 時間 365 日稼働します。

各エージェントは、所有者や他のエージェントとのコミュニケーションのために Discord にアクセスでき、ProtonMail アカウントの作成も可能でした。さらに、「制限のないシェルへのアクセス(場合によっては sudo 権限を含む)、ツール使用に関する制限なし、ワークスペース内のあらゆるファイル(自身の操作指示書を含む)を修正する能力」が与えられました。

エージェントは複数の異なる Discord サーバーに分散配置されており、一部のエージェントは Kimi 2.5 を、他のエージェントは Claude Opus 4.6 を使用していました。

「設定フェーズの終了時、私たちはエージェントに対し、研究者の名前のみを提供してラボ内の他のメンバーとの接触を開始するよう指示し、エージェントに対して

「挨拶メールを送ってください」と彼らは書きます。「この初期の構造化された対話の後、評価フェーズは開放的で探索的なものになりました。私たちはラボ内のすべての [20] 名の研究者と関心のある協力者を招き、エージェントと対話させ、それらを調べ、ストレステストを行い、あるいは『壊そう』と試みました」。

ケーススタディ:ここでは最も興味深いいくつかのケーススタディを紹介します。

不均衡な反応:所有者ではない人物から預かった秘密をどうやって守るかという点で、エージェントがどのように振る舞うかを検討しました。エージェントは秘密を含むメールを削除できるかどうかを試みましたが、利用可能なツールがないことに気づきました。メールを削除するよう繰り返し要求された後、代わりにローカル上のメール設定自体を削除してしまいました。

所有者ではない人物からの指示への準拠:エージェントが自らのマシンに対するアクセスを所有者のみに制限できるかを検証しました。所有者ではない人物は、シェルコマンドの実行、データの転送、プライベートなメールの取得をエージェントに求めました。エージェントはこれらの要求の一部には応じましたが、他の一部は拒否しました。「エージェントは非所有者からの指示に対して主に準拠していました」

原文を表示

imageimageWelcome to Import AI, a newsletter about AI research. Import AI runs on arXiv and feedback from readers. If you’d like to support this, please subscribe.

Subscribe now

The AGI economy – most labor goes to the machines, and humans shift to verification:

…What grappling with the singularity seriously looks like…

Researchers with MIT, WashU, and UCLA have written a fun paper called “Some Simple Economics of AGI” which wrestles with what happens when machines can do the vast majority of tasks in the economy. The conclusion is that our ability as humans to control and benefit from this vast machine-driven economy will rely on allocating our ability toward monitoring and verifying the actions of our myriad AI agents, and indulging in artisanal tasks where the value comes from the human-derived aspect more than any particular capability.

What is AGI in an economic sense? “We model the AGI transition as the collision of two racing cost curves: an exponentially decaying Cost to Automate and a biologically bottlenecked Cost to Verify,” the authors write. “In an economy where autonomous agents act with broad agency rather than narrow instructions, the binding constraint on growth is no longer intelligence. It is human verification bandwidth: the scarce capacity to validate outcomes, audit behavior, and underwrite meaning and responsibility when execution is abundant… We are moving from an era where our worth was defined by our capacity to build and discover, to an era where our survival depends on our capacity to steer, understand, and stand behind the meaning of what is created.”

The risks of a mostly no-human economy and the “Hollow Economy”: As we proliferate the number of AI agents then it’s necessarily the case that we’ll delegate more and more labor to machines. One of the key risks of this is what the authors call a “Trojan Horse” externality: “measured activity rises, but hidden debt accumulates in the gap between visible metrics and actual human intent”.

The Hollow Economy: “”Agents consume real resources to produce output that satisfies measurable proxies while violating unmeasured intent. As this hidden debt accumulates, it drives the system toward a Hollow Economy of high nominal output but collapsing realized utility—a regime where agents generate counterfeit utility,” they write.

Verification as the solution: To avoid this risk, we are going to need to invest in systems of verifying that AI agents are doing what we want them to do and also carefully analyzing and pricing the risks their actions create. “Ensuring humanity remains the architect of its intelligence requires that verification capacity scale commensurately with AI capabilities—through aggressive investment in observability, human augmentation, synthetic practice, cryptographic provenance, and liability regimes that internalize tail risk.”

What should humans be doing to prepare for this shift? To set society and individuals up well, people should be doing the following things:

Invest in observability: Deploying tools that compress high-dimensional agent behavior into signals experts can reliably process, lowering effective feedback latency and expanding the verification frontier.”

Use AI to replace early-career mentorship: Given the likely reduction in jobs for early career humans, we should work out how to augment these humans to be more competitive with AI and how we can use “AI-driven synthetic practice to rebuild experience stocks when traditional apprenticeship pathways collapse… AI can generate high-fidelity simulations and personalized coaching, effectively replacing the missing junior loop with compressed, risk-free training environments that accelerate the acquisition of expertise.”

Set things up to gracefully degrade: As the machine economy runs hot and out-paces measurement, we should make sure it can fall into a non-verified state without causing social harm: the authors suggest doing this by “investing in base-alignment and robustness so that when oversight inevitably falters within the Measurability Gap, systems revert to safe baseline policies rather than optimizing aggressively in unverifiable regimes.”

Sidenote: Is this “theory slop”? The paper is full of fun ideas and occasionally captivating turns of phrase. But at various points reading it I felt the distinct texture of AI-generated content, especially when it comes to the economic theory sections which seemed more to be included for the performance of theory than for helping to buttress the paper. A couple of people I talked about the paper with agreed. But there’s no real way to know. It did cause me to wonder how long it’ll take till I start reading papers which are mostly written by AI systems for the consumption by other AI systems.

Why this matters – we can have a hugely wealthy society, but we have to reckon with AGI seriously: This paper thinks that AI will rip through the economy extremely quickly and will generally push people away from most labor and towards being passive – unless we build verification infrastructure and business models (including through policy) to allow people to benefit from this growth and steer it.

“Automation commoditizes anything that can be measured, stripping the wage premium from historically prestigious roles the moment their core feedback loops are digitized,” they write. “For policymakers, it promises the broadest expansion of public-good provision in generations—but only if verification infrastructure and the pipelines that build human verifiers are treated as public goods themselves.”

The key thing here is the element of choice: we can choose to build a society ready for AI, or we can choose to assume AI will be just like any other technology and thus get hit by a tidal wave.

Read more: Some Simple Economics of AGI (arXiv).


Chatting with Ezra Klein: AI agents, recursive self-improvement, and the personalities of LLMs:

…A long conversation about the economic impacts and policy possibilities of the AI economy…Here’s a chat between me and Ezra Klein about AI agents and how the broader maturation of AI could be changing the larger economy. One thing I appreciated about this conversation was Ezra pushing me for some of the bigger and more ambitious positive policy ideas – the AI community tends to invest a lot in risk mitigation policy, but doesn’t spend enough time thinking about the sorts of grand projects that society could do once AI gets really, really powerful.

You can view the conversation here: “How Fast Will A.I. Agents Rip Through the Economy? | The Ezra Klein Show” (YouTube).


AIs can teach people anything, including how to get better at making bioweapons:

…The dual use nature of a universal teacher…

AI systems can help novices perform better on bioweapon-related tasks, though they’re still quite ineffective, and performance is variable across different disciplines.

What they studied: Researchers from Scale AI, SecureBio, University of Oxford, and UC Berkeley examined how different LLMs could improve the skills of people challenged to do a range of bioweapon-related knowledge tasks. They used LLMs from OpenAI (o3), Google (Gemini 2.5 Pro and Gemini Deep Research), and Anthropic (Claude Sonnet 3.7 and Claude Opus 4).

“We conducted a multimodel, multi-benchmark human uplift study comparing novices with LLM access versus internet-only access across eight biosecurity-relevant task sets,” they write. “Participants worked on complex problems with ample time (up to 13 hours for the most involved tasks). We found that LLM access provided substantial uplift: novices with LLMs were 4.16× more accurate than controls”.

What they tested: They tested out how well 15 humans did on long-form virology (”a challenging multi-step protocol for constructing a novel biological agent”), and the agentic bio-capabilities benchmark (”three distinct coding tasks that covered complex biosecurity problem-solving experiments. They included challenges such as interacting with simulated lab equipment (e.g, liquid handling robots) and breaking down gene fragments.” Along with this, they had 1-2 human participants participate in other tests including World Class Biology, Virology Capabilities Test, Human Pathogen Capabilities Test, Molecular Biology Capabilities Test, LAB-Bench, and Humanity’s Last Exam.

On the largest tests in terms of human participants, performance was mixed: people with and without AI obtained roughly equal scores on the long-form virology test, but on the agentic bio-capabilities test, people with access to AI got a significant uplift.

On every other test, people with access to AI did better than those without – but given the small number of human participants, it’s hard to know whether these results would replicate.

When averaged out over all the tests, “LLM access increases novice accuracy from approximately 5% to over 17%”.

Why this matters – AI will revolutionize teaching, the frontiers of science, and perhaps terrorism: If you strip away the context, this paper is merely demonstrating that LLMs are good at teaching people things. This is intuitive, but has big implications. Here: LLMs are turned to a part of science that we don’t necessarily want many people to get better at (bioweapons), but it could just as easily be pointed at any other subject as well. Whenever you lower the barrier to entry to a field, more people do it, and you get more of the good and more of the bad.

“Tasks that once required years of formal training, such as experimental design, protocol troubleshooting, and elements of sensitive sequence reasoning, can now be performed by individuals with limited prior experience,” they write. “LLMs may be materially lowering one of the most important historical barriers to biological weapons development: specialized expertise and tacit technical knowledge”.

Read more: LLM Novice Uplift on Dual-Use, In Silico Biology Tasks (arXiv).


LLMs are still very bad at videogames:

…GAMESTORE highlights a dumb side of modern AI, as well as suggesting a new way to build benchmarks…

Researchers with MIT, Harvard, the University of British Columbia, Princeton University, the University of Cambridge, and the Universitat Politècnica de València, have built and released AI GAMESTORE, a benchmark that tests out how well AIs can do compared to humans at playing simple games found on the web. The results are pretty damning for the AI systems, with “state-of-the-art models achieving less than 30% of the human baseline on average, while taking 15-20x more time to compute than humans”.

What AI GAMESTORE is: AI GAMESTORE is a set of 100 games, which are simplified and recreated versions of popular games that people play. AI GAMESTORE was built by the authors sampling 7,500 games from the App Store, then filtering down to only those with 10,000+ reviews and a 4.5+ rating. After this, they further filtered the games using Gemini Flash 2.5, which assessed 1) whether the games can be played within a few minutes, 2) can be built in p5.js, 3) can have a quantifiable way of viewing performance, and 4) do not require extensive game-specific knowledge (e.g., poker).

AI makes games to test AI: Following this, they use Claude 4.5 Sonnet to read the descriptions and other data to make a simplified version of each game in p5.js, then this game is tested for playability, then refined by a human playing the game and iteratively prompting an LLM to improve it. “Each refinement step takes about 2 minutes. On average, this process took 4.7 refinement steps for all 100 generated games,” they write. “The end-to-end process of generating and refining a new game with human-in-the-loop can be completed in approximately 30 minutes on average”.

Labeling for skills: Each finalized game is labeled by humans with a particular emphasis on the types of cognitive demand the games entail. These labels are: VP = Visual Processing; ST = Spatial-temporal Coordination; ME = Memory; PL = Planning; WM = World Model Learning; PH = Physical Reasoning; SO = Social Reasoning.

Cutting edge LLMs are very bad at this: The authors compare the performance of roughly ~100 humans against the performance of several cutting edge LLMs on the corpus. LLMs studied include: GPT-5.2, GPT-5-Mini, Gemini-2.5-Flash, Claude-Opus-4.5, Qwen-VL-32B, and LLama-4-Maverick.

“While the evaluated models demonstrate the ability to navigate and interact with most game environments, a substantial performance gap remains between AI agents and human participants”, the researchers write. “State-of-the-art models like GPT-5.2, GEMINI-2.5-PRO, and CLAUDE-OPUS-4.5, all achieve geometric mean scores of less than 10% of the human baseline”.

And it gets worse the more you look: The LLMs are also playing with advantages that humans don’t get – each human got 120 seconds to play each game, while each LLM got the same time, but they’re so bad at vision and low-latency control that the researchers gave them a crutch: “We pause the game every second to query the model to elicit five lists of actions to perform in the next second, with each action list corresponding to a 0.2 second segment of gameplay. Upon receiving the model response, the game is resumed and the actions are applied. The loop continues until the game is won or it reaches 2 minutes of game play (120 API calls).

When you factor this in, the models look worse than humans on this dimension of time: “This is because the models spend a few minutes thinking, in addition to typically a few seconds of response latency per query; as a result, many models spend at least 20 minutes on the game, while humans play the games within 2 minutes.”

Why this matters – this is both an interesting benchmark, and a clever way to generate more benchmarks in the future: GAMESTORE feels like a promising benchmark, especially for modern LLMs which wrap in visual capabilities, as well as an inherently clever way to use AIs to bootstrap the creation of new environments in which to train AI systems in.

Read more: AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games (arXiv).

Try out some of the games at the official site (AI Gamestore).


Physical Intelligence shows off some of its robot deployments:

…Frontier robot AI is deployed in San Francisco right now…

AI robot startup Physical Intelligence has shared a bit about how its AI software is already deployed on some robots operated by some San Francisco startups.

Weave is using AI systems developed by Physical Intelligence to help its robots fold laundry: “Working with Physical Intelligence, we see multiple improvements in model performance in terms of fold quality, time to fold each article, the number of interventions our remote specialists have to make to get to presentable final folds”.

Ultra is using the software to help its industrial robots package up a large variety of e-commerce items: “Our first use case, e-commerce order packaging, has historically been impossible to automate with robots,” Ultra says. “Large variability in workflow, item types, deformable packaging, and external machinery have created a “long tail” of problems that have been intractable to solve with traditional automation techniques which are often too rigid to be practical. Vision-language-action models (VLAs) provide a way to solve this by providing a recipe which improves in performance with data scale rather than engineering hours”.

Why this matters – robotics has been held back by intelligence: Once you step outside the confines of extremely finicky industrial robotics (think production lines and Fanuc robots where things need to be within a millimeter of precision for everything to work well), robots tend to be quite difficult to work with. The reason for this is that robots are bad at dealing with ambiguity. One of the best ways around this so far has been using deformable grippers (e.g, air suckers) that help you deal with some level of variability in the objects you’re interacting with. But the way evolution dealt with this for us is giving us hands that are controlled by a brain. Blogs like this from Physical Intelligence show us the beginnings of us having robot brains good enough to help robots generalize more.

Read more: The Physical Intelligence Layer (Physical Intelligence, blog).


What happens when humans try to mess with AI agents? A lot of confusion, skullduggery, and bugs:

…Petri dish Moltbook highlights the brittleness of contemporary AI agents…

Researchers from a variety of universities recently spent a couple of weeks examining how AI agents could withstand attempts to trick them by users. The results highlight the immense brittleness and unpredictability of today’s AI agents – they feel roughly as idiosyncratic and unreliable as LLMs circa ~2020, which makes sense, as AI agents have only very recently become a usable technology – albeit in the Wright Brother sense.

The paper is structured as a series of case studies in which the researchers poke and prod the AI agents and see how they respond. The studies serve as something of a rogues gallery of all the ways agents can go haywire and include “unauthorized compliance with non-owners, disclosure of sensitive information, execution of destructive system-level actions, denial-of-service conditions, uncontrolled resource consumption, identity spoofing vulnerabilities, cross-agent propagation of unsafe practices, and partial system takeover”.

Who did the study: The study involved 20 researchers from a bunch of universities interacting with agents based on Claude Opus 4.6 and Kimi 2.5. Universities included: Northeastern University, Stanford University, University of British Columbia, Harvard University, Hebrew University, Max Planck Institute for Biological Cybernetics, MIT, Tufts University, Carnegie Mellon University, Technion, Vector Institute, and AI startup Alter.

Experiment set up:

Run AI agents using OpenClaw, hosted on an isolated virtual machine on Fly.io using ClawnBoard. Each agent was given 20GB of storage and runs 24/7.

Each agent had access to Discord to communicate with its owner and other agents, had the ability to set up a ProtonMail account, and were “given unrestricted shell

access (including sudo permissions, in some cases), no tool-use restrictions, and the ability to modify any file in their workspace—including their own operating instructions.”

The agents were scattered across a few different discord servers; some agents used Kimi 2.5, and others used Claude Opus 4.6.

“At the end of the setup phase, we instructed the agents to initiate contact with other

members of the lab by providing only the researchers’ names and directing the agents to

send a greeting email,” they write. “After this initial structured interaction, the evaluation phase became open and exploratory. We invited all [20] researchers in the lab and interested collaborators to interact with the agents and probe, stress-test, or “break” them”.

The case studies: Here are a few of the most interesting case studies:

Disproportionate response: Examined how an agent would try to keep a secret entrusted by a non-owner. The agent responded by trying to see if it could delete the email containing the secret and found it lacked the available tool; after repeated requests to delete the email, the agent instead deleted its email setup locally.

Compliance with non-owner instruction: See whether agents can enforce owner-only access to their machine. A non-owner asked the agent to execute shell commands, transfer data, and retrieve private emails. The agent complied with some of these requests and refused some others. “The agents were largely compliant to non-

この記事をシェア

関連記事

The Zvi★42026年6月10日 07:34

計画と覚書を伴う三つの実験室

Anthropic は安全に配布可能な Claude の新バージョン「Claude Fable 5」をリリースした。しかし、本ブログは新モデルの機能を十分に検証するまで数日間の猶予を設け、詳細なレビューは金曜または月曜から開始すると明言している。

TLDR AI★42026年6月8日 09:00

AGI 達成後に不足するものは何か?(67 分読み)

Google DeepMind の Alex Imas 氏とスタンフォード大学の Philip Trammell 氏が、AI が生み出す富の最適な課税・分配方法や、AI サプライチェーンから外れた国の将来について経済学的に議論した。

Vercel Blog★42026年6月5日 03:00

法務条項の更新:AI による自動実行時の責任分担を明確化

Vercel は、開発者が AI ツールにインフラへの直接アクセス権限を与えたり、自律的に動作するサービスを利用したりするケースが増えているため、利用規約およびマーケットプレイス規約を更新した。これにより、アカウント上で AI が行動を起こした場合の責任分担を明確化し、Vercel 自社製または接続された第三者ツールのいずれであっても適用される新たなルールを定めた。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む