Import AI 451:政治的スーパーインテリジェンス、Googleの「心の社会」、そしてロボットドラマー
スタンフォード大学のAndy Hall教授は、AIが「政治的スーパーインテリジェンス」を通じて市民の政治参加を支援し、政策立案を強化する可能性について論じ、その実現には技術開発だけでなく社会構造の整備が不可欠だと主張している。
キーポイント
政治的スーパーインテリジェンスの定義と可能性
AIは単なる情報提供を超え、分析や理解を支援する「インテリジェンス」を提供し、市民が権力に対抗し効果的に行動するツールとなり得るとされる。
3つの構成レイヤーの提示
政治的スーパーインテリジェンスは、政府がデータを活用する「情報レイヤー」と、市民に代わって政治を監視・提案する「代表レイヤー」など複数の層で構成されると分析されている。
技術開発と社会構造の両輪
AIシステムの高性能化だけでなく、自由を維持するための社会構造や評価基準を迅速に構築することが、このビジョンを実現する上で重要であると指摘されている。
政治的スーパーインテリジェンスの代表層と所有権の問題
AI代理人が政治監視や政策立案を行うためには、敵対的なプロンプティングへの耐性確保に加え、AI企業との利益衝突を防ぐための代理人の所有権に関する再考が必要である。
ガバナンス層と公共の制御
強力なAIシステムが少数の民間企業に支配されないよう、モデルの「憲法」を編集・監督する仕組みや、市民がこれらのシステムを活用できるガバナーステムの構築が不可欠である。
透明性規制と標準APIの必要性
社会が繁栄するためには、AIシステムの動作を監視・理解するための技術的ツールの開発に加え、透明性規制と社会がシステムに介入するための共通の標準APIの導入が必要である。
DexDrummerの技術的アプローチ
高レベルの強化学習ポリシーでスティック軌道を生成し、低レベルの器用なポリシーで手を制御する階層的な2段階方式を採用し、接触カリキュラムにより複数のドラムヒットを連鎖させる訓練を行った。
影響分析・編集コメントを表示
影響分析
この記事は、AIの応用領域がコーディングやコンテンツ生成から政治・ガバナンスといった社会インフラの核心へと拡大しつつあることを示唆しています。技術的な進歩だけでなく、民主主義の仕組みを再定義する社会的・制度的な議論が急務であることを示しており、政策立案者やAI倫理研究者にとって重要な示唆を含んでいます。
編集コメント
技術的なAI能力の向上だけでなく、それをどう社会システムに組み込むかという「政治学×AI」の視点は、今後の規制議論や企業責任においてますます重要になるテーマです。
imageAI 研究に関するニュースレター「Import AI」へようこそ。本誌は arXiv と読者からのフィードバックに基づいて運営されています。ご支援いただける場合は、ぜひ購読してください。
今すぐ購読する
AI は「政治的スーパーインテリジェンス」の構築を可能にするかもしれません:
…しかし、これを社会全体の利益に変えるには、多くの意図的な取り組みが必要です…
AI システムがより強力になり、コーディングから他の分野へと実世界への影響を広げるにつれ、人々が政治において自分自身のために主張するのを助けたり、政治家が政策をより良く策定するのを支援したりするために有用になる可能性が高まっています。しかし、スタンフォード大学の政治経済学教授であるアンディ・ホール氏によれば、「政治的スーパーインテリジェンス」が存在し、私たちを助ける世界を実現するには、単に AI システムを改良するよりもはるかに多くの課題があります。
「AI はある意味で印刷機のようなものです。情報を安価かつ容易に入手可能にするのではなく、知能そのものを安価かつ容易に入手可能にするのです。つまり、ユーザーに情報を与えるだけでなく、情報を発見し、分析し、理解へと変換するのを助けることができるのです」とホール氏は記述しています。「AI との関わりや研究を深めるほど、私はこのように信じるようになります。私たちが適切に設計すれば、地球上のすべての人間が一種の政治的スーパーインテリジェンス(political superintelligence)へのアクセスを得られるようになるでしょう。」
政治的スーパーインテリジェンスとは何か。ハルがここで指すのは、市民、代表者、および制度に対して「現実をより鋭く認識し、トレードオフを理解し、権力に対抗し、より効果的に行動するためのツールを提供する」AI システムのことである。政治的スーパーインテリジェンスは、その技術を構築する AI 企業、技術そのもの、そしてその技術と相互作用する制度や人々の両方にまたがるものである。
「私は AI の速度を落とすことには関心がない。私が関心を持っているのは、AI がより強力になるにつれて私たちが自由を保つための構造をいかに速く構築するかである」とハルは記している。
政治的スーパーインテリジェンスの3つの層:ハルは、政治的スーパーインテリジェンスが3つの明確な層から構成されると見ている。
情報層:「AI は政府がデータにアクセスし理解する方法、問題を特定する方法、市民の声に耳を傾ける方法、そしてサービスを配布する方法を劇的に変えることができる」。ただし、この未来を実現するには、政府が関心を持つような情報の種類において AI システムがどのように振る舞うかについてのより良い評価が必要であり、また政策決定者向けに直接 AI ツールを開発する人々も必要となる。
表現層:「政治的なスーパーインテリジェンスは、各々に政治の場で常に奉仕する疲れ知らずの自動化された代理人を与えることで、この監視問題を解決するのに役立つかもしれません」と彼は書きます。「これらの AI 代理人が私たちのために政治を監視し、どのように投票すべきかを提案したり、人間監督者と共に政策決定者として機能さえする可能性があります。」この層を構築するには、エージェントが私たちに代わって確実に行動できることを保証し、敵対的なプロンプティングによって揺さぶられないようにする必要があります(政治家たちが人々のために働くエージェントの信念を揺さぶることを意図して設計されたキャンペーンに資金を提供するかもしれない状況を想像してください)。また、エージェントの所有権について再考することも重要かもしれません。特定の政策選択がそのエージェントを運営する AI 企業の好みに反した場合どうなるのでしょうか?
ガバナンス層:「たとえ政治的なスーパーインテリジェンスを達成し—even if AI makes voters brilliant and delegates faithful—(AI が有権者を賢くし、代理人を忠実なものにしたとしても)—、これらの能力は少数の民間企業が所有・運営するインフラストラクチャ内に存在することになります」と彼は書きます。「政治的なスーパーインテリジェンスが到来した際に、私たち国民がそれを活用できるようにするために、ルールを記述する方法が必要です。」これを行うには、企業がモデルについて作成する『憲法』をどのように統治し編集するかを見極めるとともに、これらの AI システムを監督するための効果的な方法を発展させることが必要になります。
なぜこれが重要なのか——政治的スーパーインテリジェンスを構築することは、人々や制度とのインターフェースの質次第でその価値が決まります。デフォルトとして、私たちは非常に高度なレベルで政治(およびその他あらゆる事柄)について思考できる極めて強力な AI システムを得ることになります。ホールが指摘する課題は、これらのシステムが繁栄した社会をもたらすためには、システムの UX や UI に関する計画的な努力が不可欠である点です——つまり、どのようにしてそれらと対話するのか?信頼性を持つための技術的手段は何か?彼らが生成する情報は誰に提供されるのか?これらのシステムの制御権はどこにあり、その制御を監督するシステムは何か?
この部分を正しく行うためには、AI 開発者は人々が AI システムを理解し監視するための技術的ツールや、これらのシステムの振る舞いについて人々から熟議フィードバックをより効果的に収集するためのツールへの投資を強化する必要があります。政策立案者や一般市民は、この点において AI 企業により高い要求を行うべきであり、最終的には、AI 企業の透明性制度に関する一連の規制と、社会が企業および企業が構築するシステムと対話し、実証データを生成してその振る舞いを誘導するための共通の標準「API」セットを確立する必要があります。
続きを読む:Building Political Superintelligence (Free Systems, Substack)。
恐れることはありません、ドラマーの皆さん、今のところ AI による自動化から守られています:
…DexDrummer は、極めて困難なロボットハンドの問題に取り組んでいます…
AI の進歩のペースに少し不安を感じたときは、いつも arXiv の「ロボティクス」セクションに切り替えて論文を読み、大きな安堵感を覚えます。ご存知の通り、ロボットは非常に作り込むのが難しく、現実世界ではどんなに高度な技術でも失敗しがちです。さらに困難なバージョンとして、ロボットハンドで何かをさせるための微細かつ低遅延の巧緻制御があります。そこで私は、現代の AI 手法がどれほどロボットハンドを使ってドラム演奏ができるかを検証する論文「DexDrummer」を読み、苦笑いと共感の入り混じった気持ちになりました。結論はシンプルです:ロボットハンドはひどいドラマーなのです!
彼らがやったこと:彼らは「階層的な2段階のドラム演奏ポリシー」であるDexDrummerを構築しました。これには、高レベルの強化学習(RL)ポリシーと、低レベルの器用さを持つポリシーが含まれています。彼らのシステムは、両手ロボットセットアップとフルドラムセット(スネア、トム、ライド、ハイハット、クラッシュ)を含むシミュレーション環境で訓練されます。メインシステムはタスク空間内でスティックの軌道(trajectory)を生成し、その後、低レベルシステムが手を制御しようとします。この部分は複雑であり、親指と人差し指がドラムスティックの中心をつかむように促すことに加え、「過度な腕の動きを減らす」ための「アームペナルティ制約」も含まれています。また、ロボットが複数のドラムヒットを連続して行えるようにするための形状報酬(shaping rewards)の作業も行われており、これはエージェントが軌道報酬に従いながら自由空間で軌道追従を練習できるようにする「コンタクトカリキュラム」を通じて達成されています。
実世界でのテスト:訓練されたポリシーは、2本の7自由度(DOF)Franka Pandaアームと2本の20自由度Tesollo DG-5Fハンドを用いて実際にテストされました。この分野では、このタスクがいかに悪魔的に難しいかについてある程度の感覚を得るために、ぜひオンラインの動画をご覧いただくことを強くお勧めします。ロボットはドラムを叩くことができますが、見ていて痛々しく不器用であり、私の感覚では、人間のプロのドラマーが「肩越しに振り返る」必要があるようになるまでには、まだかなりの時間がかかるでしょう。
なぜこれが重要なのか – ロボティクスは最後の評価基準:動的で急速に変化する環境(例えば、生バンドと即興でドラムを演奏するなど)におけるロボティクスは、AI にとって最後のフロンティアの一つのように感じられます。そしてこの研究が示すように、現代のコンピュータビジョン研究と同様に、AI に良好なパフォーマンスを発揮させるためには、非常に複雑な職人的なポリシー(polices)を構築する必要があります。ここでは、事前学習された言語モデルのような汎用性からまだ遥かに遠い段階です。
さらに読む:DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming (arXiv)。
どうか、お願いですから、良い時間を過ごすために動画をチェックしてください:DexDrummer サイト。
Google は、AI の整合性における真の課題は、主に非生物的知能からなる世界に対処することにあると考えています:
…社会の心の形成に向けて…
Google の研究者たちは、知性の未来は世界を支配する単一の巨大なシステムを構築することに重点を置くのではなく、人間と連携して動作する膨大な数の AI エージェントに対応できる制度をいかに構築するかを見極めることにあると考えています。この研究は直感的であり、挑発的かつ合理的で、現代の AI システムが質問に答えるために内部で複数の人格をシミュレートしていることを示した先行技術的研究(Import AI 444)に基づいています。これは、今日の AI システムですらすでに複雑な生態系のように機能している可能性を示唆しています。
「私たちは、前回の知性の爆発が発生した場所と同じ場所で、次の知性の爆発を探すべきです:それは、多数の社会的知性を持つ心同士の協力的・競争的かつ創造的な相互作用の中にあります。今回の違いは、それらの心のほとんどが非生物的であることです」と Google は記述しています。「チーム科学、小集団社会学、社会心理学のツールキットが、次世代 AI 開発のための設計図となるでしょう。」
歴史が道を示します:「過去の各『知性の爆発』は、個々の認知ハードウェアのアップグレードではなく、新たな社会的に集約された認知単位の出現でした」と彼らは記述しています。
霊長類の知性:社会集団の規模に応じて拡大した。
人間の言語:世代を超えて知識を蓄積させる「文化的ラチェット」を可能にした。
文字の発明、法制度、官僚機構:社会知能をインフラと制度へと変換し、長期的な時間軸にわたる調整を可能にした。(「スーメールの書記が穀物会計システムを運営していても、そのマクロ経済機能を理解していなかった。システムは機能的には彼よりも知的だった。」)
AI と人間の制度:より強力な AI への道筋は、単一の巨大なオラクルを構築することではなく、より豊かな社会システムを構成することにある—そしてこれらのシステムはハイブリッド型となるだろう。
社会のアップグレードが必要:これには暗黙的に、AI の統治がますます多くの AI システムが私たちのために適切に動作していることを検証すること(例えば、Import AI #447)を含むという事実が含まれる。「政府は、民間部門や政府の他の機関によって展開される AI システムをチェックし、バランスを取る機能を有する、明確に投資された価値観—透明性、公平性、適正手続き—を持つ AI システムを必要とするだろう」と彼らは記述している。
なぜこれが重要なのか – アライメントは世界の外ではなく、世界の中でそして世界と共に行われるものである:AI セーフティに取り組む多くの人は長年、単一の AI システムの基本的な性質を「アライメント」させることに時間を費やしてきた。これは大まかに言えば、「望む通りに動作し、あなたを殺そうとしたり権力を奪おうとしない」という意味である。しかし、この論文が正しく指摘しているのは、たとえ私たちがアライメントに成功したとしても、その後 AI システムが社会の中でうまく機能し、私たちや互いと効果的に協力できるようにする必要があるということだ – これは微妙で、創発的であり、予測が難しいプロセスとなるだろう。つまり、AI 中心の世界を統治するために適した制度を設計する必要があるのだ。「人間社会が個人の徳ではなく、役割と規範によって定義された裁判所、市場、官僚機構といった持続的な制度的テンプレートに依存しているのと同様に、スケーラブルな AI エコシステムにはデジタル版が必要となる」と研究者らは述べている。
さらに読む:エージェント型 AI と次の知能爆発 (arXiv)。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
Meta は、Anthropic のモデルを自己改善へと導くためのハッチネス(枠組み)を利用しています。
…LLM にいくつかのツールと再帰ループ、そしてそのハッチネス自体を編集する能力を与え、一歩引いて魔法が起きるのを待てばよいのです…
ブリティッシュコロンビア大学、Vector Institute、エディンバラ大学、ニューヨーク大学、CIFAR、および Meta の研究者たちは、任意のタスクにおいてパフォーマンスを自己改善できる LLM 用のハッチネスを開発しました。このアプローチは「ハイパーエージェント」と呼ばれ、LLM に、タスクでのパフォーマンスを起動するためのプロンプトを反復的に改善し、将来のプロンプト生成をより上手に行うためのシステム自体も改善できる足場を与えることを意味します。ハイパーエージェントは世代を超えて機能するため、1 つのハイパーエージェントが数個のハイパーエージェントを生み出し、タスクで最も優れたものがさらに多くのハイパーエージェントを誕生させます。これにより、パフォーマンスが飽和するまで複数の層からなる AI の家系図が形成されます。
サイバーパンク的な今年の名称賞:「ハイパーエージェント」は実際には「ダーウィン・ゴデルマシン・ハイパーエージェント」の略です。研究自体が素晴らしいことに加え、超知能がレーザービームを操って月面に刻み込みたいと思うような名前を考案した著者たちにお祝い申し上げます。
ハイパーエージェントの仕組み:ハイパーエージェントは、タスク解決を行う「タスクエージェント」と、自身およびタスクエージェントを修正する「メタエージェント」を単一の編集可能なプログラムに統合した「自己参照型エージェント」です。研究者らは、「このメタレベルでの修正手順自体も編集可能であり、これによりメタ認知による自己修正が可能となり、タスク解決の振る舞いだけでなく、将来の改善を生み出すメカニズムそのものも向上する」と述べています。「この初期ハイパーエージェントには2つのツールが備わっています。1つはシェルコマンドを実行するためのbash ツール、もう1つはファイルの検査と修正を行う専用ツールです」。
4 つの異なるドメインでのエージェントのテスト:著者らは、ハイパーエージェントを4 つの問題に適用して検証しました。それらは、コーディング(多言語対応)、予測(論文レビュー)、ロボティクス(ロボット報酬設計)、数学的理解(オリンピックレベルの数学採点)です。ほとんどの問題では、ベースモデルとして Claude Sonnet 4.5 を使用しますが、1 つ例外があります(Polyglot)。評価は複数の異なるモデルを通じて行われます:o3-mini(Polyglot)、GPT-4o(論文レビュー)、Claude Sonnet 4.5(ロボット報酬設計)、および o4-mini(IMOレベルの採点)。
すべてのケースにおいて、ハイパーエージェントのアプローチはベースラインを大幅に上回る性能向上をもたらしました。
Polyglot:「エージェントにコードリポジトリと、所望の変更を記述した自然言語の指示が与えられ、それに応じてリポジトリを変更する必要がある」。
結果:「5 回の試行全体で、DGM-H は 50 タスクからなる Polyglot サブセットにおけるトレーニングパフォーマンスを、初期エージェントの 0.140 から 0.340(信頼区間:0.300 – 0.380)へと改善した」。
論文レビュー:「各タスクにおいて、エージェントには AI 研究論文の全文が与えられ、二値の採択/却下判断を予測する必要がある」。
結果:「テストタスクにおいて、DGM-H は論文レビューのパフォーマンスを初期エージェントの 0.0 から 0.710(信頼区間:0.590 – 0.750)へと改善した」。
ロボティクス報酬設計:「ロボティクスタスクの自然言語記述が与えられた場合、エージェントは適切な報酬関数(reward function)を生成する必要がある。この報酬関数はその後、強化学習(RL)を用いてシミュレーション上で四足歩行ロボットを訓練するために使用される」。
結果:「DGM-H はパフォーマンスを初期エージェントの 0.060 から 0.372(信頼区間:0.355 – 0.436)へと改善し、評価指標を直接最適化するデフォルトの報酬関数(0.348)を上回った」
なぜこれが重要なのか – シングularity の自己起動:このような論文は、適切な足場と出発材料を与えられれば、今日の AI システムがすでに自律的にパフォーマンスを向上させる能力を持っていることを示しています。興味深いアイデアとして、ここで紹介された設計アプローチに、AI システムが自分自身を微調整する能力(例えば、PostTrainBench 研究や Import AI #449 で想像されているようなスタイル)を与えることを組み合わせることです。もう一つの限界は、「ハイパーエージェントは自己改善メカニズムを変更できますが、どのエージェントが選択されるか、またはどのように評価されるかを決定する外部プロセスを変更することはできません」という点ですが、それでも私はこれらの両方の目標を達成するための技術的な方法があると考えています。
もちろん、任意のドメインで自律的に自身を向上させることができる AI システムには、一連の安全性上の課題があり、その中には潜在的に壊滅的なものも含まれます。著者たちはこの点を認識しつつ、先にある問題についても現実的に対応しています。「中心的な課題は、AI を人間の進歩と福祉のための触媒(例えば、科学発見の自動化)としての可能性と、人間がこれらのシステムに置く信頼の度合い(例えば、継続的な人間の検証を必要とせずに決定や行動を委任すること)とのバランスを取ることであり、多くの潜在的なリスクと欠点を最小限に抑えることです」と述べています。
さらに読む:Hyperagents (arXiv)。
HyperAgents のコードはこちらで入手できます (Facebook Research, HyperAgents)。
新しい数学ベンチマーク「HorizonMath」はどれほど続くのでしょうか?
…新テストでは、AI システムに未知の問題を解決させた後、自動的に回答を検証します…
また新たな難解な数学ベンチマークが登場しました。来年の AI 進歩の前にはすぐに崩壊するだろうと私は想像しています。今回は「HorizonMath」で、応用数学および計算数学の 8 つの分野にわたる 100 の「主に未解決」とされる問題から構成されています。このベンチマークは、オックスフォード大学、ハーバード大学、プリンストン大学、そしてエリソン・テクノロジー研究所の研究者たちによって構築されました。
HorizonMath の特徴:
汚染防止機能:「解が未知であるため、それらはどのトレーニングコーパスにも存在せず、モデルによって生成された正しい解答は、真の推論能力と自律的な発見を示すことになります」。
自動検証:著者たちは、「本ベンチマークの中核となる特徴は、完全に自動化され、再現可能で、人間を介さない評価パイプラインである」と述べています。「高精度な数値比較および決定制約チェックャーを用いて検証を自動化しています」。
HorizonMath が含むもの:HorizonMath の 100 問は、3 つの軸に沿って分類されています。1 つ目は出力タイプで、数値的に近似された目標値に対する正確な閉形式式の特定から離散的数学的オブジェクトの生成まで、モデルがタスクをどのように解決すべきかを指定します。2 つ目は解けるレベルで、「レベル 0」(既知の閉形式を持つ問題)から「レベル 3」(未解決と推測されるか、有限の閉形式を持たない可能性のある問題)まで広がります。3 つ目は数学的ドメインで、数論から離散幾何学、数学定数に至るまでのドメインの種類を指定します。
安心できるほど難しい:フルデータセット全体では、最高スコアを獲得したのは GPT 5.4 Pro で 7% です。それに続くのは Opus 4.6 と Gemini 3.1 Pro で、両者とも同率の 3% です。「レベル 0」(つまり最も簡単な問題)においては、GPT 5.4 Pro が 50% の達成率で首位に立ち、Opus 4.6 と Gemini 3.1 は再び同率でそれぞれ 30% です。
次のステップ:彼らはベンチマークを 2 つの方向に拡張する予定です。まず、受け入れる解決策の種類をより寛容にする一方、「現在の 3 つの問題カテゴリを超えて拡張し、証明に基づく検証を必要とする未解決問題を含めるとともに、Lean などの形式体系と統合する」ことです。
なぜこれが重要なのか – おそらく、真に創造的な AI システムは数学の分野から現れるでしょう。今日、AI システムは数学の最前線で活動しており、Gemini などのシステムはすでに人間が看似て新しい数学的証明を考案するのを支援しています(Import AI 441)。また、「First Proof」といったテストも登場し、公に議論されたこともない、ましてや解決されたことのない問題に対して AI システムがいかに対応できるかを検証しています(Import AI 445)。HorizonMath を用いることで、AI が「創造性のルビコン川」を越え、未解決の問題の解決を開始しようとしているかどうかを確認するための有用なベンチマークがもう一つ手に入ります。
詳しく読む:HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification (arXiv)。
ベンチマークはこちらで入手可能:HorizonMath (GitHub)。
Tech Tales:
サイトレポート
[2029 年]
地下に設置された計算資源および電力の割合:70%(前年比 +50 ポイント)。
施設内に完全常駐するスタッフ数:300 名(+250 名)。
現在の供給量と約 500 名の人口を想定した場合の「ハードシール」状態の推定継続期間:4 ヶ月(+3 ヶ月)。
国内他プロジェクトに対する本プロジェクトの進捗リードタイム:6 ヶ月。
能力見積もり:自社最上位システムの 90%〜110%。
推奨事項:閉ループ開発のための施設強化に割り当てられた資源が大幅に増加したことを踏まえ、
原文を表示
imageWelcome to Import AI, a newsletter about AI research. Import AI runs on arXiv and feedback from readers. If you’d like to support this, please subscribe.
Subscribe now
AI might let us build “political superintelligence”:
…But turning this into a societal upside requires lots of intentional work…
As AI systems get more powerful and broaden their real world impact from coding to other domains, it seems likely that they could also become useful for helping people advocate for themselves in politics, and helping politicians better craft policy. But getting to a world where a “political superintelligence” exists and helps us is a lot more challenging than just building better AI systems, according to Andy Hall, a political economy professor at Stanford.
“AI is like the printing press, to a point. Instead of making information cheap and easily available, it makes intelligence cheap and easily available. That is, it not only serves users information, but it can find it for them, analyze it for them, and help them convert it into understanding,” Hall writes. “The more I work with and study AI, the more I believe it can give every human being on the planet access to a sort of political superintelligence, if we shape it right.”
What is a political superintelligence? By this, Hall means AI systems which allow people to have “tools that help citizens, representatives, and institutions perceive reality more sharply, understand tradeoffs, contest power, and act more effectively”. A political superintelligence spans both the AI companies that build the technology, the technology itself, and the institutions and people which the technology interacts with.
“I’m not interested in slowing AI down. I’m interested in speeding up how we build the structures that keep us free as AI gets more powerful,” Hall writes.
Three layers for political superintelligence: Hall sees political superintelligence as being composed of three distinct layers.
The information layer: “AI can massively change how governments access and understand data, identify problems, hear from citizens, and distribute services”. Though getting to this future will require better evaluations for how AI systems behave when it comes to the sorts of information governments might be interested in, and it’ll require people to build AI tools directly for policymakers.
The representation layer: “Political superintelligence might help solve this monitoring problem by giving each of us a tireless, automated delegate always serving us in the political sphere,” he writes. “These AI delegates could monitor politics for us and suggest how to vote—or even serve as policymakers alongside human supervisors.” Building this layer requires us to ensure that agents can reliably act on our behalf, that they aren’t swayed by adversarial prompting (imagine how politicians might fund campaigns explicitly designed to sway the beliefs of agents working on behalf of people). It may also be important to re-think agent ownership – what happens if a particular policy choice goes against the preferences of the AI company which operates the agents?
The governance layer: “Even if we achieve political superintelligence—even if AI makes voters brilliant and delegates faithful—those capabilities would sit inside infrastructure owned and operated by a small number of private companies,” he writes. “We need a way to write the rules so that, when political superintelligence arrives, we the people are able to harness it.” Doing this will require figuring out how to govern and edit the ‘constitutions’ that companies create about their models, as well as developing an effective way of overseeing these AI systems.
Why this matters – building a political superintelligence is only as valuable as its interfaces with people and institutions: We are by default going to get extremely powerful AI systems which can think about politics (and everything else) at a very sophisticated level. The challenge Hall outlines is that getting these systems to lead to a thriving society requires significant intentional work around the UX and UI of these systems – how do we interface with them? What sorts of technical means do we have of being confident in them? What information do they generate and to whom? Where does control of these systems lie and what systems supervise that control?
Getting this part right requires AI developers to invest more in technical tools which can help people make sense of and oversee their AI systems, as well as tools for better gathering deliberative feedback from people about how these systems behave. Policymakers and the public need to demand more of AI companies in this respect, and ultimately I think there are a range of regulations that need to get stood up around a transparency regime for AI companies as well as some common set of standard ‘APIs’ by which society can interact with the companies and the systems they build to generate empirical data and provide steering over their behavior.
Read more: Building Political Superintelligence (Free Systems, Substack).
Fear not, drummers, you’re safe from AI automation for now:
…DexDrummer tackles a fiendishly hard robot hand problem…
Whenever I get a bit worried about the pace of AI progress I toggle over to the ‘robotics’ sub-section of arXiv, read some papers, and feel a huge sense of relief. Robots, as everyone knows, are extremely hard to do well, with reality tending to screw up even the most advanced techniques. An even harder version of robotics is fine-grained low-latency dexterous control, where you need to get a robot hand to do something. So it’s with a combination of amusement and empathy that I read DexDrummer, a paper testing out how well contemporary AI approaches can get a robot hand to play the drums. The short answer is: robot hands are pretty terrible drummers!
What they did: They built DexDrummer “a hierarchical, two-stage policy for drumming” which has a high-level RL policy, as well as a low-level dexterous policy. They train their system in a simulated environment that contains a bimanual robot setup and a full drum set (snare, tom, ride, hi-hat, and crash). The main system generates a stick trajectory in task space, then a low-level system which tries to control the hand – this part is complex and involves encouraging the thumb and index finger to grasp the center of the drumstick paired with an “arm penalty constraint, which reduces excessive arm movements”. There is also work shaping rewards to ensure the robot is able to chain multiple drumhits together – this is achieved via a “contact curriculum” which allows the agent to practice trajectory following in free space while following the trajectory reward.
Real world testing: They test out the trained policy in reality on two 7-DOF Franka Panda arms and two 20-DOF Tesollo DG-5F hands. This is an area where I’d strongly encourage people to view the videos online to get some calibration about just how fiendishly hard this task is – the robots are able to hit the drums, but it’s painfully awkward to watch, and my sense is it’ll be quite a while till a human drummer has to look over their proverbial shoulder.
Why this matters – robotics as the last eval: Robotics in anything approximating a dynamic, rapidly changing environment (for instance, improvising drums with a live band) feels like one of the last frontiers for AI – and as this research shows, much like with modern computer vision research, getting AI to perform well requires the crafting of highly complicated artisanal policies. We’re a very long way from the generality of pretrained language models here.
Read more: DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming (arXiv).
Please, I am begging you, check out the videos for a good time: DexDrummer site.
Google thinks the real challenge of AI alignment is dealing with a world made up of mostly non-biological intelligences:
…Towards a society of minds…
Researchers with Google think that the future of intelligence is less about building a monolithic singleton that runs the world and more figuring out how to build institutions that are capable of dealing with a vast proliferation of AI agents working in tandem with humans. The research is intuitive, provocative, and sensible, and builds on earlier technical work that showed that modern AI systems appear to simulate multiple personalities within themselves to help them answer questions (Import AI 444), suggesting that even today’s AI systems already work like complex ecologies.
“We should be looking for the next intelligence explosion in the same place from which the previous ones emerged: in cooperative, competitive and creative interaction between multitudes of socially intelligent minds. The difference this time is that most of those minds will be non-biological,” Google writes. “The toolkits of team science, small-group sociology, and social psychology become blueprints for next-generation AI development.”
History shows the way: “Each prior “intelligence explosion” was not an upgrade to individual cognitive hardware, but the emergence of a new, socially aggregated unit of cognition,” they write.
Primate intelligence: Scaled with the social group size.
Human language: Allowed knowledge to accumulate across generations via a ‘cultural ratchet’.
Writing, law, and bureaucracy: Converted social intelligence into infrastructure and institutions that could coordinate across long time horizons. (”A Sumerian scribe running a grain accounting system did not comprehend its macroeconomic function; the system was functionally more intelligent than he was.”)
AI plus human institutions: “The path to more powerful AI runs not through building a single colossal oracle but through composing richer social systems—and these systems will be hybrid”.
Society needs an upgrade: Implicit to this is the fact that governing AI will increasingly involve verifying (e.g, Import AI #447) that a vast number of AI systems are working on our behalf appropriately. “Governments will need AI systems with distinct, explicitly invested values—transparency, equity, due process—whose function is to check and balance AI systems deployed by the private sector and other branches of government,” they write.
Why this matters – alignment is going to happen with and in the world, not outside of it: Many people working on AI safety have long spent time on getting the fundamental properties of a single AI system to be ‘aligned’, which roughly translates to “does what you want and doesn’t try to kill you or disempower you”. But what this paper correctly identifies is that even if we succeed at alignment we’re going to have to then get AI systems to work well within society and to collaborate effectively with us and with each other – and this will be a subtle, emergent, hard-to-predict process. This means we are going to need to design the institutions that are fit for governing an AI-centric world. “Just as human societies rely not on individual virtue but on persistent institutional templates – courtrooms, markets, bureaucracies – defined by roles and norms, scalable AI ecosystems will require digital equivalents,” the researchers write.
Read more: Agentic AI and the next intelligence explosion (arXiv).
Meta uses a harness to coax Anthropic’s models into self-improvement:
…Give an LLM some tools and a recursive loop and the ability to edit its harness, step back, and let the magic happen…
Researchers with the University of British Columbia, Vector Institute, University of Edinburgh, New York University, CIFAR, and Meta have built a harness for LLMs that has the ability to self-improve performance for arbitrary tasks. The approach is called a hyperagent, and it means giving an LLM a scaffold that can iteratively improve the prompts it uses to bootstrap its performance on tasks as well as the system it uses to get better at generating future prompts. Hyperagents work over generations, so one hyperagent begets a few hyperagents and the ones which do the best on the task will themselves spawn some more hyperagents, forming multiple layers of AI genealogy until performance is saturated.
Cyberpunk name of the year award: Hyperagent is actually short for “Darwin Godel Machine Hyperagents”: Besides the research being cool, my congratulations to the authors on coming up with a name I’d love to see chiseled into the moon by a laserbeam wielded by a superintelligence.
How hyperagents work: Hyperagents are “self-referential agents that integrate a task agent (which solves the target task) and a meta agent (which modifies itself and the task agent) into a single editable program. Crucially, the meta-level modification procedure is itself editable, enabling metacognitive self-modification, improving not only task-solving behavior, but also the mechanism that generates future improvements,” the researchers write. “This initial hyperagent is equipped with two tools: a bash tool for executing shell commands, and a specialized tool for inspecting and modifying files.”
Testing the agents in four different domains: The authors test out hyperagents by applying them to four problems – coding (polyglot), prediction (paper review), robotics (robotics reward design), and math understanding (olympiad-level math grading). For most problems, the Hyperagents use Claude Sonnet 4.5 as their base model, with one exception (Polyglot). Evaluations are done via several different models: o3-mini (Polyglot), GPT-4o (paper review), Claude Sonnet 4.5 (robotics reward design), and o4-mini (IMO-level grading).
In all cases, the hyperagent approach improves performance significantly above the baseline.
Polyglot: “the agent is given a code repository and a natural language instruction describing a desired change, and must modify the repository accordingly”.
Results: “Across 5 runs, the DGM-H improves its training performance on the 50-task Polyglot subset from 0.140 (the initial agent) to 0.340 (CI: 0.300 – 0.380).”
Paper review: “For each task, the agent is given the full text of an AI research paper and must predict a binary accept/reject decision”.
Results: “On test tasks, DGM-H improves paper review performance from 0.0 (the initial agent) to 0.710 (CI: 0.590 – 0.750)”
Robotics reward design: “Given a natural language description of a robotics task, an agent must generate a suitable reward function. This reward function is then used to train a quadruped robot in simulation using RL”
Results: “DGM-H improves performance from 0.060 (the initial agent) to 0.372 (CI: 0.355 – 0.436), surpassing the default reward function that directly optimizes the evaluation metric (0.348)”
Why this matters – bootstrapping the singularity: Papers like this show that today’s AI systems are already capable of autonomously improving their performance when given the right scaffold and starting ingredients. An interesting idea is to combine the design approach here with giving the AI systems the ability to finetune themselves (e.g, in the style imagined by the PostTrainBench research, Import AI #449). Another limitation is that “although hyperagents can modify their self-improvement mechanisms, they cannot alter the outer process that determines which agents are selected or how they are evaluated” – though again, I think there are technical ways to achieve both of these objectives.
Of course, an AI system that can autonomously improve itself on arbitrary domains has a range of safety issues, some of which are potentially cataclysmic. The authors acknowledge this while also being realistic about the problems that lie ahead: “a central challenge lies in balancing the potential of AI as a catalyst for human progress and well-being (e.g., automating scientific discovery) with the degree of trust humans are willing to place in these systems (e.g., delegating decisions or actions without requiring continuous human verification), while minimizing the many potential risks and downsides,” they write.
Read more: Hyperagents (arXiv).
Get the code for HyperAgents here (Facebook Research, HyperAgents).
How long will a new math benchmark, HorizonMath, last?
…New test challenges AI systems to solve unknown problems, then automatically verifies the answers…
Another day brings another hard math benchmark that I imagine will crumple in the face of ongoing AI progress in the coming year. This time it’s HorizonMath, a benchmark containing 100 “predominantly unsolved” problems across 8 domains in applied and computational mathematics. The benchmark was built by researchers with the University of Oxford, Harvard University, Princeton University, and the Ellison Institute of Technology.
Special features about HorizonMath:
Contamination-Proof: “Because the solutions are unknown, they do not exist in any training corpus, and any correct solution produced by a model would therefore signal genuine reasoning ability and autonomous discovery.”
Automated verification: “A core feature of our benchmark is its fully automated, reproducible, and human-free evaluation pipeline”, the authors write. “We automate verification using high-precision numeric comparison and deterministic constraint-checkers”.
What HorizonMath contains: HorizonMath’s 100 problems are classified along three axes: output types, which specifies how the model needs to solve the task ranging from identifying an exact closed-form expression for a numerically approximated target value, to the production of discrete mathematical objects; solvability levels, which span ‘level 0’ (problems with known closed forms) to ‘level 3’ (problems that could be conjectured unsolvable or lack finite closed forms); and mathematical domains, which specifies the type of domain ranging from number theory to discrete geometry to mathematical constants.
Reassuringly hard: On the full dataset, the highest scoring model is GPT 5.4 Pro with 7%, followed by Opus 4.6 and Gemini 3.1 Pro which both tie at 3%. On the “Level 0” (aka, the easiest) problems, GPT 5.4 Pro leads at 50% completion, with both Opus 4.6 and Gemini 3.1 in a tie again at 30% each.
Next steps: They will expand the benchmark in two ways, first by liberalizing the sorts of solutions that they will take in, as well as by “extending beyond the three current problem categories to include open problems that require proof-based verification, integrating with formal systems such as Lean”.
Why this matters – perhaps the first truly creative AI systems will show up in mathematics: AI systems are pushing on the frontiers of math today, with systems like Gemini already helping humans to come up with seemingly original math proofs (Import AI 441), and tests like “First Proof” emerging which examine how well AI systems can handle problems that have never been talked about publicly let alone solved (Import AI 445). With HorizonMath, we have another useful benchmark to help us see if AI is about to cross some ‘creativity rubicon’ and begin solving unsolved problems.
Read more: HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification (arXiv).
Get the benchmark here: HorizonMath (GitHub).
Tech Tales:
Site report
[2029]
Percentage of compute and power below ground: 70% (+50 absolute points).
Number of staff living fully onsite: 300 (+250).
Estimated duration of ‘hard seal’ based on current supplies and a projected population of ~500: 4 months (+3 months).
Estimated lead of the project relative to others in-country: 6 months.
Capability estimates: 90%-110% of our own leading system.
Recommendation: Based on the substantial increase in resources allocated to hardening the facility for closed-loop development,
関連記事
経済フォーラムAIで人々をつなぐ
GoogleはワシントンD.C.で開催される「AI for the Economy Forum」において、関係者を集めて議論を促進する取り組みを行っている。
AI #161 第2部:AIをめぐるすべての議論
記事は、AIに関する政策や議論の反復性を指摘しつつ、実際のAI能力の向上と戦争という変化を対比している。今週の政策、議論、アライメント分野の動向をまとめたものである。
AIの不適切な導入が人員削減の背景にある可能性
クラウドデータ・AIコンサルティング企業のDatatonicは、人間とAIの協働の不適切な導入が、生産性や競争力の低下を招き、結果として人員削減につながっていると指摘している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み