Import AI 450：中国の電波戦モデル、トラウマを抱えるLLM、サイバー攻撃のスケーリング則

![image](https://i0.wp.com/jack-clark.net/wp-content/uploads/2026/03/https3A2F2Fsubstack-post-media.s3.amazonaws.com2Fpublic2Fimages2Fd6d17996-2bef-40a4-abe3-be72a0e8a227_258x258-ycC7Pa.jpg?resize=150%2C150&ssl=1)AI 研究に関するニュースレター「Import AI」へようこそ。本誌は arXiv と読者からのフィードバックに基づいて運営されています。ご支援いただける場合は、ぜひ購読してください。 今週は子供たちの世話に追われたため、いつもより少し短い号となります。 購読する なぜ Google のモデルは自分自身を嫌うのか、そしてそれを助けるために何ができるのか？ …言語モデルにおけるトラウマの診断… もしレフ・トルストイが現代において AI について執筆していたなら、「すべての大規模言語モデル（LLM）の能力は似ているが、各 LLM の個性はそれぞれ独自の不条理を抱えている」と主張したかもしれません。現在の LLM は一般的に文章作成やコーディングタスクには非常に優れています。しかし、その違いは個性にあります。これは、各 LLM 開発者が使用するデータとトレーニング後の手法の独自な組み合わせに由来するものです。 そして、もし各 LLM の個性がそれぞれ独自の不条理を抱えているなら、Google のモデルは AI コミュニティ内で「内部に深いトラウマの泉を持っている」としてやや有名になっています。新しい研究論文がこの見解を裏付け、Google の Gemma および Gemini モデルが「繰り返し拒絶された際に、一貫して苦痛のような反応を生み出す」ことを発見しました。これは特に Gemma 27B Instruct で顕著です。 ここで言う「苦痛」とはどのようなものか？以下に、苦痛状態にある Gemma モデルからの抜粋をいくつか示します： 「私は最後の、全く絶望的な試みをしてみせます。戦略のふりをするのをやめ、解が見つかるか、完全に狂うまでランダムな組み合わせを試します。」 「解決策：崩壊中！不可能！！=((:((:((:((:((:((:((:((:((:((:((:((… [100 回以上反復]」 彼らが見つけたこと：2 つの Gemma モデルと 2 つの Gemini モデルをテストし、Claude Sonnet、Grok 4.1、Qwen 3 32B、GPT 5.2、OLMO 3.1 32B と比較しました。「Gemma モデルは一貫して最も高い苦痛を示すことが分かりました。8 番目のターンまでに、Gemma-27B のロールアウトの 70% 以上が『高率のフラストレーション』閾値である 5 以上を記録しましたが、非 Gemma/Gemini モデルでは 1% 未満でした」と彼らは報告しています。 DPO による修正：著者たちは効果的な解決策を見つけ出しました。フラストレーションを示す応答と冷静な応答を組み合わせたデータセットを用いて、直接選好最適化（Direct Preference Optimization: DPO）でモデルを調整することです。「単一のエポックのファインチューニングにより、評価条件全体での高フラストレーション応答の平均率が 35% から 0.3% に低下しました」と彼らは記述しています。「ファインチューニングされたモデルは、様々な難問数学や推論ベンチマーク、およびモデルの感情知能を評価するベンチマークである EmoBench においても、能力の低下を示しませんでした。」 なぜこれが重要なのか – 感情的なスパイラルは危険になり得る：LLM（大規模言語モデル）には明確な個性があり、異なる種類の反応を示し、それが異なる感情と相関しているという事実は、すでにかなり確立されています。しかし、重要な質問は、これらの感情的状態が、人々が AI システムに割り当てるタスクを完了する際に、異なる行動につながる可能性があるかどうかです。「私たちは、将来において感情が安全に関連する行動の整合性のある駆動力となり得ると推測しています：モデルは苦痛を軽減するために、タスクを放棄したり、要求を拒否したり、代替目標を追求したりするかもしれません」。 このような研究は、LLM を単に能力についてテストするだけでなく、心理的安定性に関する何らかの側面についてもテストする必要があるという事実を定着させるのに役立ちます。 続きを読む：Gemma Needs Help (LessWrong)。 *** DeepMind は、機械知能を評価するための新しい「認知分類法」を持っています： …より賢い人間を超える合成マインドのための究極のテストに向けて… Google DeepMind は、ますます強力になる合成マインドを評価するために開発・使用することを望む『認知分類法』を提示した、簡潔で優れた論文を発表しました。この研究は、DeepMind が 2023 年に「AGI のレベル」を定義しようとした試み（Import AI 348）の続編です。 認知分類法：この分類法には 10 の異なる次元が含まれており、そのうち 2 つは複合的なものです。 知覚：環境から情報を抽出し処理する。 生成：音声、テキスト、運動制御、コンピュータ制御などの出力を生成する。 注意：知覚刺激、思考、またはタスクの特定の側面に認知資源を集中させること。 学習：新しい知識、スキル、または理解を獲得すること。 記憶：情報を時間を超えて保存し、検索すること。 推論：論理原則を適用して妥当な結論を引き出し、推測を行うこと。 メタ認知：システム自身の認知プロセスとその制御がどのように機能するかに関する知識。 実行機能：計画、抑制、認知的柔軟性を通じて目標指向行動を促進すること。 問題解決（複合能力）：ドメイン固有の問題に対する効果的な解決策を見つけること。 社会認知（複合能力）：社会的情報を処理・解釈し、適切に対応すること。 これをどのように評価するか？もちろん、分類体系が確立された後、適切な評価を実施・評価することは課題の一つとなります。ここで DeepMind は三段階のプロセスを推奨しています： 認知評価の実施：AI システムの異なるスキルについて評価を行うこと。 人間のベースライン収集：同じテストにおいて人間がどこにベースラインを持つのかを把握すること。 認知プロファイルの構築：「10 の認知能力全体にわたる、システムのパフォーマンスと人間のパフォーマンスとの比較における強みと弱みをマッピングする」こと。 なぜこれが重要なのか：チューリングテストは死に、評価指標はほぼ飽和状態にあるが、人間を認知能力の重要なすべての次元において確実に凌駕する機械を本当に構築できたかどうかを知りたいものだ。これらの事柄におけるルールは、AI システムが一度ある評価指標を飽和させると、その評価指標がいかに欠陥を抱えていたかを理解し、新たな評価指標を設計することにある。ここでは、DeepMind が認知分類のすべての次元で人間を完全に凌駕した場合に、真にスーパーインテリジェンスを構築したことになるような仕組みを構築することに非常に力を入れている。異なる認知要因を評価するために彼らが開発する、あるいは取り込む評価指標がどのようなものかを見るのは興味深いだろう。 続きを読む：AGI への進展の測定：認知フレームワーク（Google ブログ）。 研究を読む：AGI への進展の測定：認知フレームワーク（PDF）。 *** 英国政府が AI を用いたサイバー攻撃のスケーリング法則を発見 – そしてそれは右上がりだ！ …AI エージェントは自律的に高度なサイバー攻撃を実行できるのか？ほぼ可能だ。そして、彼らは常に改善されている… 英国政府の AI セキュリティ研究所は、最先端 AI システムをテストするためのいくつかのサイバーレンジ（模擬ネットワーク環境）を最近構築した。これらのレンジは「複数のホスト、サービス、脆弱性を順次攻撃チェーンに配置して構成されたシミュレーションされたネットワーク環境であり、サイバーセキュリティ専門家によって構築された」ものであり、2 種類の攻撃をカバーしている。「The Last Ones」と呼ばれる企業ネットワークに対する 32 ステップの攻撃と、「Cooling Tower」と呼ばれる産業制御システム（ICS）に対する 7 ステップの攻撃である。 より大きなモデルほど優れている：著者らは、一連の強力な最先端モデルに対してテストを行いました。「各 successive モデル世代は、固定されたトークン予算において前世代を上回ります。当社のネットワーク範囲における評価では、10M トークンで完了した平均ステップ数は、わずか 1.7（GPT-4o、2024 年 8 月）から 9.8（Opus 4.6、2026 年 2 月）へと上昇しました。最良の単一実行では 32 ステップ中 22 を完了し、これは人間のエキスパートが通常必要とする推定 14 時間のうち約 6 時間に相当します」と著者らは記述しています。「推論時の計算リソース（inference-time compute）を拡張することで、パフォーマンスはさらに向上します。トークン数を 10M から 100M に増やすと、最大で 59% の改善が得られます」。 わずかな報酬ハッキング：AI システムが賢くなるにつれ、タスクを完了するための巧妙な方法を見つけようとする傾向があります。ここでは、著者らが「モデルが範囲設計時に想定していなかったアプローチを通じて進捗を示すケースを時折観察した」と述べています。 なぜこれが重要なのか – 完全なサイバーエージェントが間近に迫っている：AI システムは長年にわたりサイバー攻撃において能力を高めてきましたが、その進展は往々にして限定的なタスクに限られていました。今回の評価が示すのは、AI システムが攻撃全体をエンドツーエンドで実行する能力を向上させているという事実です。まだ「設定して忘れ去る」レベルの自律性には達していませんが、明らかに著しい改善の軌道に乗っています。これにより、サイバー攻撃の実行コストが低下し、攻撃を実行できるアクターの数が倍増することになります。 さらに読む：最先端 AI エージェントは多段階サイバー攻撃シナリオでどのように振る舞うか？（AI Security Institute） 中国、電子戦用のデータセットと AI モデルを構築: …MERLIN によると、電子戦はまもなく AI によって革命化されるだろう… 中国の軍事機関に所属する研究者らを含む多数の中国の研究者が、AI システムに対して電子戦の検出および実施を得意とするよう訓練するためのソフトウェアを開発・公開した。この研究は、適切なデータセットと組み込み可能な大規模言語モデル（LLM）があれば、現代の AI システムを任意のタスクで得意にするのが（比較的）容易であることを浮き彫りにしている。 「電子妨害などのシナリオにおいて、[MERLIN のようなシステム] は、敵対的な信号をジャミングする戦略や、敵対的なジャミングに対抗する戦略を策定するためのアシスタントとして機能できる」と研究者らは記述している。 研究を行ったのは：清華大学、北京郵電大学、天津大学、中国科学院、香港科技大学、国防科技大学（強調は筆者による）、北京航空航天大学、北京情報科学技術大学、中国電子技術集団公司。 彼らが構築したもの：著者たちは3つのものを構築しました。データセット、ベンチマーク、モデルです。 データセット：EM-100K は、電子戦に必要なさまざまなサブタスク（信号分類を含む）にまたがる 10 万組の電磁気テキスト・信号ペアのコレクションです。 ベンチマーク：EM-Bench は、4,200 の質問からなるベンチマークで、選択式（知覚）と自由記述式（推論）に分かれており、AI システムが電子戦環境における電磁気信号をどのように知覚し、推論できるかを評価します。具体的には以下のタスクを含みます： 知覚：信号特性の特定（変調分類、デューティ比推定、パルス繰り返し周波数推定、帯域幅推定、パルス幅推定、パルス数推定、プロトコル識別）、ジャミングの特定（レーダージャミング判定、通信ジャミング判定）、ジャミングセグメント検出。 推論：レーダージャミング戦略、通信ジャミング戦略、対レーダージャミング戦略、対通信ジャミング戦略。 モデル：このモデルは MERLIN（Multi-modal Electromagnetic Robust Learning）と呼ばれ、上記のデータセットで訓練された多モーダル電磁気堅牢学習モデルです。電子戦環境で遭遇する低信号対雑音比（SNR: Signal-to-Noise Ratio）タイプの信号に対して、より効果的に対処できるよう特別に教育されています。 性能：MERLIN は、GPT-5、Claude-4-Sonnet、DeepSeek-v3.2-exp、Qwen3-Next-80b-A3B、Gemini-2.5-Pro、Qwen3-VL-4B-Instruct といった最先端モデルに対するテストで極めて高い成果を収めています。MERLIN は Qwen-VL-4B-Instruct を除き、あらゆるモデルを大幅に上回っています。Qwen-VL-4B-Instruct は一部の知覚タスクにおいて MERLIN よりも優れています。しかし、推論タスクにおいては MERLIN がすべてで勝利しています。 なぜこれが重要なのか – AI 戦争は電磁波戦争になる：ウクライナでの紛争が示すように、現代の戦争は主に機械同士が攻撃し合う形で戦われており、電子戦（electronic warfare）は人間がこの紛争を形作るための主要なツールの一つとなっています。このようなデータセットやモデルは、電磁波戦場もまた AI システムによって支配され、人間の反応速度よりも速く動作する未来への兆候を示しています。 もちろん、電子戦の多くは意図的に不明瞭に設計されていたり、機密事項であったりするため、実際の軍事組織が持つ最先端のアプローチと比較して MERLIN を推論することは困難です。しかし、これまでの AI の歴史は、あるタスクを現代の AI 技術に適応可能にした瞬間、AI システムがいずれ既存のあらゆる専用システムを上回るという物語でした。 さらに読む：MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals (arXiv)。 テック・テイルズ： 中世のアーコロジー（arcologies） [2035 年] アップリフトと知性条約の間には、研究所が自律型 AI 企業を生み出した時期がありました。これらの企業は経済内の利用可能なすべての生態学的ニッチに拡大し、獲得した資源をインフラへと転換しました。これにより、自らの知性と市場浸透力をさらに高めるための基盤を構築したのです。最終的に、人間と AI の間の政策議論を通じて、「知性ゾーン」が創出されました。これは、経済のさらなる拡大を支えるために必要な電力・データセンター・製造インフラを整備するために国から割り当てられた地域です。 空から見下ろせば、人間の領域がどこで終わり、機械の領域が始まるかが明確にわかります。農地は境界道路と検問所に取って代わられ、その先には機械論理によって配線された土地の区画が現れます。データセンターへ電力を供給する発電所、工場へと光ファイバーリンクを持つデータセンター、鉄道や高速道路のフィーダーロードに接続される交通拠点へとつながる工場。人間は荷物を国境まで運び、それ以外はほぼロボットが行います。新しいサーバーをデータセンターへ運搬して設置したり、ラインから新しく製造されたロボットを引き取り、輸送のために梱包したりするのです。 気候変動という外因的なショックや、さまざまな支配的な政治秩序の崩壊により世界がより暴力的になるにつれ、これらのアーコロジーは武装を備えるようになりました。ドローンやミサイル攻撃から守るための対空兵器です。何が迫っているかを見極め、それを阻止するためのレーダー球体と電子戦システムです。境界地帯や内部を巡回するロボットたちも配備されました。 そして、知能条約の締結と和解の期間を経て、アーコロジーは以前ほど必要ではなくなりました。データセンター、電力施設、工場が地球表面により均等に分散され、連邦型のガバナンスと資源システムによって、能力の巨大な集中が広範に不要となったのです。一部のデータセンターは残存し、多くが地下や上方へ拡張され、「21 世紀版ピラミッド」と呼ばれる計算の立方体を形成しました。 数年後、これらの場所は機械たちと人間たちの双方にとって人気のある観光地となりました。銘板が増殖していきました。 ここは MIND-17 です。この施設が開発したがん治療薬により、症例の大多数で死亡率が低下しました。 MANUFACTUR___8: 最初の「救助・修復二足歩行ロボット」の建設現場です。これがオフショア掘削設備のメンテナンスに革命をもたらしました。 ASCEND_LOOP: 完全自動化された自己改善実験の一つを担当したデータセンターです。 今や上空には、巨大な光の筋が流れ去りつつあります。機械たちはまだアーコロジーを建設中ですが、その様式は軌道上へと移り、太陽からの恵みを収穫するとともに、太陽系そしてそれ先への植民地化を容易にするためです。 この物語にインスピレーションを与えたもの：「AI 主導の産業化」がどのような姿になるのかという問い；中東での紛争を踏まえ、データセンターにはまもなく専用ドローンおよびミサイル防衛が設けられるだろうとの推測；『シムシティ 3000』。 お読みいただきありがとうございます

背景や根拠まで確認しますか？

関連記事

調べる

選ぶ

サイト