Algomatic AIラボの論文解説から振り返る、AIエージェント研究の変化
こんにちは、Algomatic システム変革本部 AIエンジニアの岩城祐作(@yukl_dev)です。
普段は、お客様の新規事業創出を、生成AIを使ったプロダクト開発を通じて支援しています!
今回は『Algomatic 初夏のアドベントカレンダー』と題して、メンバーそれぞれが好きな技術を好きに語る会の14日目です👏
昨日は、伊藤さんがOpenRouterのFusionの考え方をClaude Codeに取り入れてみた話を書いていました。興味がある方はぜひこちらもご覧ください。伊藤さんは声が大きくて好きです。
私たちはAlgomatic AIラボという論文解説のXアカウントを運用し、2025年9月から週に3本ほどのペースで、AI関連の技術論文を単発の解説文として発信してきました。これまでに60件以上の論文・研究レポート・記事を扱っています。
imagehttps://x.com/Algomatic_AILab
解説を続けていくなかで感じているのは、単発の投稿は最新研究を素早く届けられる一方で、論文同士のつながりや、研究領域全体の流れは見えにくくなりがちだということです。
論文によっては、ある研究で有効とされた工夫が、別の研究では限界やリスクとして扱われていることもあります。私も、個別の論文を追っているうちに、目の前の情報に振り回されそうになる感覚となることもあります。
そこで、これまで扱ってきた論文・投稿を、特定の切り口でまとめ直し、整理してみようと思います。
今回は、「AIエージェント研究」を切り口に整理していきます。
AIエージェント研究を、「どのモデルが強くなったか」「どのベンチマークで性能が上がったか」という見方ではなく、研究の中心がどこに移っているかという観点で、論文・投稿を整理してみました。
私たちのX投稿を振り返ると、AIエージェント研究はおおむね次の3段階で移り変わっていました。
- AI技術そのものと、AI × 外部技術の組み合わせで「できること」が広がる
- AI技術を実際に仕事で使うための設計が進む
- 自律化そのものより、実業務で安全に、再現性高く、検証可能に働かせるための周辺整備が前面に出る
imageAIエージェント研究「中心テーマの移り変わり」
①:AIに「できること」が増えた
私たちがX投稿を始めた2025年9月末から10月ごろは、AIに任せられる対象の拡大に関する論文の解説を多く実施していました。
AIにじっくり考えさせることで会話や文章生成の質を高める研究だけでなく、ほぼ同じ時期に、ロボット、EC、ヘルスケアといった領域とAIを組み合わせる研究・プロダクトも紹介しています。
認知タスクの拡張側で目立ったのは「Language Models that Think, Chat Better」[1]です。AI に段階的に考えさせると、答えが明確な数学やコードだけでなく、会話や文章生成のような曖昧なタスクにも推論の効果が出ることを示した研究で、「考える AI」が必ずしも論理タスク専用ではなくなり始めた例と言えます。
imagehttps://x.com/Algomatic_AILab/status/1973312015071584716?s=20
「Gemini Robotics 1.5」[2]が AI をロボットと組み合わせて物理世界に作用させる方向を示しました。「Buy it in ChatGPT: Instant Checkout and the Agentic Commerce Protocol」[3]は、会話 UI から購買行動までを連続させる流れを示しています。さらに「The anatomy of a personal health agent」[4]は、健康データ、医学知識、コーチングを役割分担し、AI を専門家チームのような構成として使う例を提示しました。
imagehttps://x.com/Algomatic_AILab/status/1976237514781491322?s=20
加えて、機密データを安全に AI で活用するための前提技術として、「VaultGemma」[5] といった研究も取り上げてきました。また、「Project Vend: Phase two」[6] のように、AI が実店舗の運営に関与する事例も現れてきていますが、これについては後半で触れます。
つまり AI エージェント研究は、AI 技術そのものの能力拡張と、外部システムとの接続が同時に進んでいました。AI は、単に答えるモデルではなく、外部世界と接続されるシステムへ広がり始めたと言えます。
②:AI に「仕事をさせる」設計が始まった
2025 年 10 月中旬から 2026 年 1 月ごろにかけて、AI 技術の活用を前提にした研究・設計が中心となってきました。私たちの X 投稿の中心テーマも、この方向へ少しずつ移っていきました。
①では「何ができるか」に焦点が当たっていました。しかし、AI に実際に仕事をさせようとすると、モデル単体の能力だけでは足りません。どの情報を渡すか、何を記憶するか、いつツールを使うか、いつ使わないか、失敗した結果をどう次に活かすかが重要になってきます。
コンテキスト全体を設計する
中心にあるのは、プロンプト単体ではなく、AI に渡す情報全体をどう設計するかという視点です。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "中心にあるのは、プロンプト単体ではなく、AI に渡す情報全体をどう設計するかという視点です。"}
「Effective Context Engineering for AI Agents」[7]は、エージェントが扱う情報・状態・履歴を、プロンプトより一段広い「コンテキスト」というレイヤーで設計する重要性を示しました。「Context Engineering for AI Agents: Lessons from Building Manus」[8]は、実務的なエージェント構築の中で得られたコンテキスト設計の知見を共有しており、研究と実装の両側から、設計対象がプロンプトからコンテキストへ広がっていることが読み取れます。
imagehttps://x.com/Algomatic_AILab/status/1978393001560056178?s=20
失敗から学ぶループとしての「自律性」
学習側では、教師ラベルや報酬関数を上から与える設計だけではない手法も多くありました。
「Agent Learning via Early Experience」[9]は、報酬がなくても、初期に得た経験や失敗からエージェント自身が学習信号を取り出す方法を扱っています。「Agent0」[10]は、外部データに頼らず、AI自身が問題を生成し解決することでモデルを進化させる方向を示しました。「Self-play SWE-RL」[11]では、コーディングエージェントが自分でバグを作り、自分で直すことで継続的に学習する例が報告されています。
imagehttps://x.com/Algomatic_AILab/status/2006987367102689527?s=20
さらにこの時点で、自律性が「勝手に賢くなる」ことというより、むしろ評価・失敗・再試行のループをシステムとして組み込むことで再現されるものとして扱われ始めていることもわかります。
ツールと検索の「使い方」を判断する
ツールも、「使えること」と「使うべきかを判断できること」が別の論点として分かれてきています。
「SMART: Self-Aware Agent for Tool Overuse Mitigation」[12]は、ツールを使えるエージェントが、いつ・どれだけ使うかを自己認知的に抑える設計を扱った研究です。「AdaSearch」[13]は、LLMが必要時のみ外部検索を呼び出すよう強化学習で制御し、不必要な検索呼び出しを大幅に削減します。
imagehttps://x.com/Algomatic_AILab/status/1998674266271752638?s=20
コンテキスト(文脈)× メモリ × ツール抑制 × 検索判断。改善ループの周辺では、Plan・Execute・Summarize 型の構造を持つ「LoongFlow」[14]、待機時間に学習する「Sophia」[15]、コスト・速度・再利用を意識した「LLMCache」[16]などの研究も並走しており、エージェントを動かす周辺機構の研究がこの時期に多くあります。
マルチエージェントは万能ではない
マルチエージェント化についても、この段階で慎重な見方が増えました。
うまく働いた例としては、第 1 段階で触れた Personal Health Agent [4] が、健康データ・医学知識・コーチングを分担する構成で成果を出しています。一方で、「Towards a Science of Scaling Agent Systems」[17]は、エージェント数を増やすことが必ずしも性能向上につながらないことを示しました。「Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline」[18]では、シングルエージェントがマルチ構成と同等以上の結果を出し得ることが報告されています。
imagehttps://x.com/Algomatic_AILab/status/1999409837067894911?s=20
このように②では、AI エージェント研究の中心が「AI に何ができるか」から「AI をどう働かせるか」へ移っていきます。
③:AI を「安全に働かせる」設計が前面に出た
そして現在にかけて、AI に任せる範囲が広がり、コンテキストやツール、自己改善ループの設計が進むほど、問題は「AI が自律的に動けるか」だけではなくなります。
なかでも2026 年 3 月から 5 月ごろが、この変化を強く感じる時期です。
むしろ重要になるのは、失敗したときに検知できるか、原因を特定できるか、危険な行動を止められるか、人間があとから検証できる形になっているか、となっていそうです。
失敗を体系化する
「AgentRx」[19]は、AI エージェントが起こす失敗の原因を体系的に特定するためのフレームワークを扱っています。エージェントが失敗したとき、それを「何となく動かなかった」で終わらせず、どの段階の・どんな性質の失敗なのかを構造化して切り分ける視点が、この段階の研究では中心になりつつあります。
imagehttps://x.com/Algomatic_AILab/status/2033480552859529573?s=20
長く動かすほど監視が難しくなる
「Classifier Context Rot」[20]は、長期実行されるエージェントを別の AI が監視するとき、時間の経過とともに監視側が危険行動を見落としやすくなる現象を扱っています。「ちゃんと見ている AI を置けば安全」が、単純には成り立たないことを示す研究です。
imagehttps://x.com/Algomatic_AILab/status/2056314348956705133?s=20
作れる時代だからこそ、安全性が問われる
AI が動くシステムを「自分で作れる」時代になったことは、①〜②で見てきました。だからこそ、生成されたシステムそのものの安全性が、これまで以上に問題になります。
「Is Vibe Coding Safe?」[21]は、Vibe Coding 的な開発で作られたシステムの安全性をベンチマークで測る試みで、AI が書ける一方で、AI が書いたものに脆弱性が残りやすい現状が報告されています。「Agent Skills in the Wild」[22]は、エージェントが外部スキルや拡張機能を取り込めるようになったことで、スキルそのものが新しい攻撃面になり得ることを指摘しました。一定割合のスキルにセキュリティ上の問題が確認されており、エージェントの拡張性は便利さと脆さの両面を持ち始めています。
imagehttps://x.com/Algomatic_AILab/status/2011001764154392952?s=20
思考過程は監視に使えるのか
「Reasoning Models Struggle to Control their Chains of Thought」[23]は、AI が提示する思考過程(Chain of Thought)を、人間が監視や検証に使えるかという問いを扱っています。長時間の推論や特定の状況によっては、AI の思考過程が実際の判断と一致しなくなる可能性も示されており、CoT を安全のための監視チャンネルとして無条件に信頼することの難しさが論じられています。
imagehttps://x.com/Algomatic_AILab/status/2038553691058487471?s=20
関連する周辺研究としては、AI 生成物の出どころをあとから検証する「事後水差し(Post-Hoc Watermarking)」[24]、「医療分野における大規模言語モデルのハルシネーションを、微細な事実確認とドメイン固有の適応で軽減する」[25]、AI の内部状態を人間が読める形に近づける「自然言語オートエンコーダー(Natural Language Autoencoders)」[26]、危険知識を学習段階で扱う「SGTM」[27]などもこの段階で扱われてきました。
AI エージェント研究は、自律 AI を作る方向だけではなく、実業務の中で AI を安全に、再現性高く、検証可能に働かせるための周辺整備 へ向かっていそうです。
ここまでの整理
ここまでの 3 段階を、一度表で並べてみます。
| 段階 | 中心テーマ | 代表的な論文・投稿 | 見えてくる変化 |
|---|---|---|---|
| ① | できることの拡張 | Language Models that Think, Chat Better[1] / Gemini Robotics 1.5[2] / Instant Checkout[3] / Personal Health Agent[4] | AI 技術そのものの能力と、外部システムとの接続によって、AI に任せられる対象が広がった |
| ② | 仕事をさせる設計 | Effective Context Engineering[7] / Manus[8] / SMART[12] / AdaSearch[13] / Agent0[10] / Self-play SWE-RL[11] / マルチエージェント関連研究[17][18] | コンテキスト、ツール、メモリ、自己改善ループ、役割分担の「どう働かせるか」の設計が必要になった |
| ③ | 安全に働かせる設計 | AgentRx[19] / Classifier Context Rot[20] / Is Vibe Coding Safe?[21] / Agent Skills in the Wild[22] / Reasoning Models Struggle to Control their Chains of Thought[23] | 自律化そのものより、「安全に働かせる」設計が前面に出てきた |
こうして並べてみると、同じ時期に別方向の研究も多く並走しているものの、AI エージェント研究の中心は「できることの拡張」から「仕事をさせる設計」へ、さらに「業務に組み込んで運用するための設計」へ移ってきているように見えます。
おわりに
こうして振り返ると、AI エージェント研究の変化は、単なる自律化の進化ではなさそうです。
研究の中心は「AI に何ができるか」から「AI をどう働かせるか」へ、さらに「AI をどう安全に、再現性高く、検証可能に働かせるか」へと、段階的に変化してきていました。自律的に動く AI を作る方向そのものは変わらないかもしれませんが、研究の関心は AI 単体の性能というより、AI が組み込まれるシステム全体の設計に移っていそうです。
だからこそ私たちは、AI エージェントを「様々な業務で自律させる対象」というより、「業務や実システムの中で安全に運用するための設計対象」として捉える必要が出てきていると感じています。
AI の性能や自律性が高まるほど、人間の関心は「AI をどこまで賢くするか」だけではなく、「AI をどのような権限で動かすか」「どの情報を渡すか」「どこで人間が確認するか」「あとから検証できる形になっているか」といった、実行環境全体の設計へ向かっていきます。
開発者から見ると当たり前に聞こえるかもしれませんが、AI エージェントを「自律する AI」ではなく、「安全に、再現性高く、検証可能に働く AI システム」として扱う場面は今後も増えていきそうです。
今後の発信について
今後も、Algomatic AI ラボでは最新論文の解説を継続していく予定です。
一方で、今回のように一定期間に扱った論文をテーマごとにまとめ直すことで、単発の投稿だけでは見えにくい研究の流れも、定期的に整理して発信していきたいと考えています。
最新論文を追うこと × 一定期間ごとに振り返ること。この 2 つを組み合わせることで、読者のみなさんが個別の論文だけではなく、研究の方向性をつかみ、自分の試行や判断のソースとして活用していただけたら嬉しいです。
Posts by Algomatic_AILab x.com
Algomatic では一緒に働く仲間を募集しています
Algomatic は新体制に移行し、採用も強化中です。AI エージェントの研究動向を踏まえた事業開発・プロダクト開発を、複数のカンパニーで進めています。
様々な観点から AI に向き合いたい方、最新研究を追いながら現場のプロダクト開発していくことに関心がある方は、ぜひお気軽にカジュアル面談へ足を運んでいただけたら嬉しいです。
参考文献
- [1] Language Models that Think, Chat Better. https://arxiv.org/abs/2509.20357
- [2] Gemini Robotics 1.5 brings AI agents into the physical world. https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world
- [3] Buy it in ChatGPT: Instant Checkout and the Agentic Commerce Protocol. https://openai.com/index/buy-it-in-chatgpt
- [4] パーソナルヘルスエージェントの解剖学。https://research.google/blog/the-anatomy-of-a-personal-health-agent
- [5] VaultGemma:世界で最も能力の高い差分プライバシーを持つ大規模言語モデル(LLM)。https://research.google/blog/vaultgemma-the-worlds-most-capable-differentially-private-llm
- [6] プロジェクト・ヴェンド:フェーズ 2。https://anthropic.com/research/project-vend-2
- [7] AI エージェントのための効果的なコンテキストエンジニアリング。https://anthropic.com/engineering/effective-context-engineering-for-ai-agents
- [8] AI エージェントのコンテキストエンジニアリング:Manus 構築からの教訓。https://manus.im/ja/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
- [9] 初期経験を通じたエージェント学習。https://arxiv.org/abs/2510.08558
- [10] Agent0:ツール統合推論によるゼロデータからの自己進化型エージェントの解放。https://arxiv.org/abs/2511.16043
- [11] 自己対戦 SWE-RL を通じたスーパーインテリジェントソフトウェアエージェントへの訓練。https://arxiv.org/abs/2512.18552
- [12] SMART:ツール過剰使用の緩和のための自己認識型エージェント。https://arxiv.org/abs/2502.11435
- [13] AdaSearch:強化学習による大規模言語モデルにおけるパラメトリック知識と検索のバランス調整。https://arxiv.org/abs/2512.16883
- [14] LoLoongFlow:認知プラン・実行・要約のパラダイムに基づく指向性進化的探索。https://arxiv.org/abs/2512.24077
- [15] SopSophia:人工生命のための永続的エージェントフレームワーク。https://arxiv.org/abs/2512.18202
- [16] LLMCache: トランスフォーマー推論における高速化のための層別キャッシング戦略。https://arxiv.org/abs/2512.16843
- [17] エージェントシステムのスケールに関する科学の構築へ向けて。https://arxiv.org/abs/2512.08296
- [18] マルチエージェントワークフローの価値を再考する:強力な単一エージェントベースライン。https://arxiv.org/abs/2601.12307
- [19] AI エージェントのための体系的デバッグ:AgentRx フレームワークの紹介。https://microsoft.com/en-us/research/blog/systematic-debugging-for-ai-agents-introducing-the-agentrx-framework
- [20] クラスifier コンテキストローテーション:コンテキスト長に伴う性能低下の監視。https://arxiv.org/abs/2605.12366
- [21] バイブコーディングは安全か?実世界タスクにおけるエージェント生成コードの脆弱性ベンチマーク。https://arxiv.org/abs/2512.03262v1
- [22] 野外でのエージェントスキル:大規模なセキュリティ脆弱性の実証的研究。https://arxiv.org/abs/2601.10338
- [23] 推論モデルは思考の連鎖を制御することに苦戦する。https://arxiv.org/abs/2603.05706
- [24] 言語モデルによる書き換えを用いた事後ウォーターマーキングの有効性はどの程度か?https://arxiv.org/abs/2512.16904
- [25] グルーナルな事実確認とドメイン固有の適応による医療用大規模言語モデルにおけるハルシネーションの緩和。https://arxiv.org/abs/2512.16189
- [26] 自然言語オートエンコーダーは、大規模言語モデルの活性化に対する教師なしの説明を生成する。https://transformer-circuits.pub/2026/nla
- [27] データフィルタリングを超えて:LLM の能力除去のための知識の局所化。https://arxiv.org/abs/2512.05648
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
原文を表示
こんにちは、Algomatic システム変革本部 AIエンジニアの岩城祐作(@yukl_dev)です。
普段は、お客様の新規事業創出を、生成AIを使ったプロダクト開発を通じて支援しています!
今回は『Algomatic 初夏のアドベントカレンダー』と題して、メンバーそれぞれが好きな技術を好きに語る会の14日目です👏
昨日は、伊藤さんがOpenRouterのFusionの考え方をClaude Codeに取り入れてみた話を書いていました。興味がある方はぜひこちらもご覧ください。伊藤さんは声が大きくて好きです。
私たちはAlgomatic AIラボという論文解説のXアカウントを運用し、2025年9月から週に3本ほどのペースで、AI関連の技術論文を単発の解説文として発信してきました。これまでに60件以上の論文・研究レポート・記事を扱っています。
[https://x.com/Algomatic_AILab](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260618/20260618110509.png)
解説を続けていくなかで感じているのは、単発の投稿は最新研究を素早く届けられる一方で、論文同士のつながりや、研究領域全体の流れは見えにくくなりがちだということです。
論文によっては、ある研究で有効とされた工夫が、別の研究では限界やリスクとして扱われていることもあります。私も、個別の論文を追っているうちに、目の前の情報に振り回されそうになる感覚となることもあります。
そこで、これまで扱ってきた論文・投稿を、特定の切り口でまとめ直し、整理してみようと思います。
今回は、「AIエージェント研究」を切り口に整理していきます。
AIエージェント研究を、「どのモデルが強くなったか」「どのベンチマークで性能が上がったか」という見方ではなく、研究の中心がどこに移っているかという観点で、論文・投稿を整理してみました。
私たちのX投稿を振り返ると、AIエージェント研究はおおむね次の3段階で移り変わっていました。
- AI技術そのものと、AI × 外部技術の組み合わせで「できること」が広がる
- AI技術を実際に仕事で使うための設計が進む
- 自律化そのものより、実業務で安全に、再現性高く、検証可能に働かせるための周辺整備が前面に出る

①:AIに「できること」が増えた
私たちがX投稿を始めた2025年9月末から10月ごろは、AIに任せられる対象の拡大に関する論文の解説を多く実施していました。
AIにじっくり考えさせることで会話や文章生成の質を高める研究だけでなく、ほぼ同じ時期に、ロボット、EC、ヘルスケアといった領域とAIを組み合わせる研究・プロダクトも紹介しています。
認知タスクの拡張側で目立ったのは「Language Models that Think, Chat Better」[1]です。AIに段階的に考えさせると、答えが明確な数学やコードだけでなく、会話や文章生成のような曖昧なタスクにも推論の効果が出ることを示した研究で、「考えるAI」が必ずしも論理タスク専用ではなくなり始めた例と言えます。
[https://x.com/Algomatic_AILab/status/1973312015071584716?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617225638.png)
「Gemini Robotics 1.5」[2]がAIをロボットと組み合わせて物理世界に作用させる方向を示しました。「Buy it in ChatGPT: Instant Checkout and the Agentic Commerce Protocol」[3]は、会話UIから購買行動までを連続させる流れを示しています。さらに「The anatomy of a personal health agent」[4]は、健康データ、医学知識、コーチングを役割分担し、AIを専門家チームのような構成として使う例を提示しました。
[https://x.com/Algomatic_AILab/status/1976237514781491322?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617225757.png)
加えて、機密データを安全にAIを活用するための前提技術として「VaultGemma」[5]のような研究も扱ってきました。「Project Vend: Phase two」[6]のように、AIが実店舗運営に関わる例も出てきていますが、こちらは後半で触れます。
つまりAIエージェント研究は、AI技術そのものの能力拡張と、外部システムとの接続が同時に進んでいました。AIは、単に答えるモデルではなく、外部世界と接続されるシステムへ広がり始めたと言えます。
②:AIに「仕事をさせる」設計が始まった
2025年10月中旬から2026年1月ごろにかけて、AI技術の活用を前提にした研究・設計が中心となってきました。私たちのX投稿の中心テーマも、この方向へ少しずつ移っていきました。
①では「何ができるか」に焦点が当たっていました。しかし、AIに実際に仕事をさせようとすると、モデル単体の能力だけでは足りません。どの情報を渡すか、何を記憶するか、いつツールを使うか、いつ使わないか、失敗した結果をどう次に活かすか、が重要になってきます。
コンテキスト全体を設計する
中心にあるのは、プロンプト単体ではなく、AIに渡す情報全体をどう設計するかという視点です。
「Effective Context Engineering for AI Agents」[7]は、エージェントが扱う情報・状態・履歴を、プロンプトより一段広い「コンテキスト」というレイヤーで設計する重要性を示しました。「Context Engineering for AI Agents: Lessons from Building Manus」[8]は、実務的なエージェント構築の中で得られたコンテキスト設計の知見を共有しており、研究と実装の両側から、設計対象がプロンプトからコンテキストへ広がっていることが読み取れます。
[https://x.com/Algomatic_AILab/status/1978393001560056178?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617225908.png)
失敗から学ぶループとしての「自律性」
学習側では、教師ラベルや報酬関数を上から与える設計だけではない手法も多くありました。
「Agent Learning via Early Experience」[9]は、報酬がなくても、初期に得た経験や失敗からエージェント自身が学習信号を取り出す方法を扱っています。「Agent0」[10]は、外部データに頼らず、AI自身が問題を生成し解決することでモデルを進化させる方向を示しました。「Self-play SWE-RL」[11]では、コーディングエージェントが自分でバグを作り、自分で直すことで継続的に学習する例が報告されています。
[https://x.com/Algomatic_AILab/status/2006987367102689527?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230009.png)
さらにこの時点で、自律性が「勝手に賢くなる」ことというより、むしろ評価・失敗・再試行のループをシステムとして組み込むことで再現されるものとして扱われ始めていることもわかります。
ツールと検索の「使い方」を判断する
ツールも、「使えること」と「使うべきかを判断できること」が別の論点として分かれてきています。
「SMART: Self-Aware Agent for Tool Overuse Mitigation」[12]は、ツールを使えるエージェントが、いつ・どれだけ使うかを自己認知的に抑える設計を扱った研究です。「AdaSearch」[13]は、LLMが必要時のみ外部検索を呼び出すよう強化学習で制御し、不必要な検索呼び出しを大幅に削減します。
[https://x.com/Algomatic_AILab/status/1998674266271752638?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230109.png)
コンテキスト × メモリ × ツール抑制 × 検索判断。改善ループまわりでは、Plan・Execute・Summarize 型の構造を持つ「LoongFlow」[14]、待機時間に学習する「Sophia」[15]、コスト・速度・再利用を意識した「LLMCache」[16]などの研究も並走しており、エージェントを動かす周辺機構の研究がこの時期に多くあります。
マルチエージェントは万能ではない
マルチエージェント化についても、この段階で慎重な見方が増えました。
うまく働いた例としては、第1段階で触れた Personal Health Agent [4] が、健康データ・医学知識・コーチングを分担する構成で成果を出しています。一方で、「Towards a Science of Scaling Agent Systems」[17]は、エージェント数を増やすことが必ずしも性能向上につながらないことを示しました。「Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline」[18]では、シングルエージェントがマルチ構成と同等以上の結果を出し得ることが報告されています。
[https://x.com/Algomatic_AILab/status/1999409837067894911?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230143.png)
このように②では、AIエージェント研究の中心が「AIに何ができるか」から「AIをどう働かせるか」へ移っていきます。
③:AIを「安全に働かせる」設計が前面に出た
そして現在にかけて、AIに任せる範囲が広がり、コンテキストやツール、自己改善ループの設計が進むほど、問題は「AIが自律的に動けるか」だけではなくなります。
なかでも2026年3月から5月ごろが、この変化を強く感じる時期です。
むしろ重要になるのは、失敗したときに検知できるか、原因を特定できるか、危険な行動を止められるか、人間があとから検証できる形になっているか、となっていそうです。
失敗を体系化する
「AgentRx」[19]は、AIエージェントが起こす失敗の原因を体系的に特定するためのフレームワークを扱っています。エージェントが失敗したとき、それを「何となく動かなかった」で終わらせず、どの段階の・どんな性質の失敗なのかを構造化して切り分ける視点が、この段階の研究では中心になりつつあります。
[https://x.com/Algomatic_AILab/status/2033480552859529573?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230214.png)
長く動かすほど監視が難しくなる
「Classifier Context Rot」[20]は、長期実行されるエージェントを別のAIが監視するとき、時間の経過とともに監視側が危険行動を見落としやすくなる現象を扱っています。「ちゃんと見ているAIを置けば安全」が、単純には成り立たないことを示す研究です。
[https://x.com/Algomatic_AILab/status/2056314348956705133?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230246.png)
作れる時代だからこそ、安全性が問われる
AIが動くシステムを「自分で作れる」時代になったことは、①〜②で見てきました。だからこそ、生成されたシステムそのものの安全性が、これまで以上に問題になります。
「Is Vibe Coding Safe?」[21]は、Vibe Coding 的な開発で作られたシステムの安全性をベンチマークで測る試みで、AIが書ける一方で、AIが書いたものに脆弱性が残りやすい現状が報告されています。「Agent Skills in the Wild」[22]は、エージェントが外部スキルや拡張機能を取り込めるようになったことで、スキルそのものが新しい攻撃面になり得ることを指摘しました。一定割合のスキルにセキュリティ上の問題が確認されており、エージェントの拡張性は便利さと脆さの両面を持ち始めています。
[https://x.com/Algomatic_AILab/status/2011001764154392952?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230340.png)
思考過程は監視に使えるのか
「Reasoning Models Struggle to Control their Chains of Thought」[23]は、AIが提示する思考過程(Chain of Thought)を、人間が監視や検証に使えるかという問いを扱っています。長時間の推論や特定の状況によっては、AIの思考過程が実際の判断と一致しなくなる可能性も示されており、CoTを安全のための監視チャンネルとして無条件に信頼することの難しさが論じられています。
[https://x.com/Algomatic_AILab/status/2038553691058487471?s=20](https://cdn-ak.f.st-hatena.com/images/fotolife/y/yukl_algomatic/20260617/20260617230410.png)
関連する周辺研究としては、AI生成物の出どころをあとから検証する「Post-Hoc Watermarking」[24]、「Mitigating hallucinations in healthcare LLMs with granular fact-checking and domain-specific adaptation」[25]、AI内部状態を人間が読める形に近づける「Natural Language Autoencoders」[26]、危険知識を学習段階で扱う「SGTM」[27]などもこの段階で扱われてきました。
AIエージェント研究は、自律AIを作る方向だけではなく、実業務の中でAIを安全に、再現性高く、検証可能に働かせるための周辺整備 へ向かっていそうです。
ここまでの整理
ここまでの3段階を、一度表で並べてみます。
段階
中心テーマ
代表的な論文・投稿
見えてくる変化
①
できることの拡張
Language Models that Think, Chat Better[1] / Gemini Robotics 1.5[2] / Instant Checkout[3] / Personal Health Agent[4]
AI技術そのものの能力と、外部システムとの接続によって、AIに任せられる対象が広がった
②
仕事をさせる設計
Effective Context Engineering[7] / Manus[8] / SMART[12] / AdaSearch[13] / Agent0[10] / Self-play SWE-RL[11] / マルチエージェント関連研究[17][18]
コンテキスト、ツール、メモリ、自己改善ループ、役割分担の「どう働かせるか」の設計が必要になった
③
安全に働かせる設計
AgentRx[19] / Classifier Context Rot[20] / Is Vibe Coding Safe?[21] / Agent Skills in the Wild[22] / Reasoning Models Struggle to Control their Chains of Thought[23]
自律化そのものより、「安全に働かせる」設計が前面に出てきた
こうして並べてみると、同じ時期に別方向の研究も多く並走しているものの、AIエージェント研究の中心は「できることの拡張」から「仕事をさせる設計」へ、さらに「業務に組み込んで運用するための設計」へ移ってきているように見えます。
おわりに
こうして振り返ると、AIエージェント研究の変化は、単なる自律化の進化ではなさそうです。
研究の中心は「AIに何ができるか」から「AIをどう働かせるか」へ、さらに「AIをどう安全に、再現性高く、検証可能に働かせるか」へと、段階的に変化してきていました。自律的に動くAIを作る方向そのものは変わらないかもしれませんが、研究の関心はAI単体の性能というより、AIが組み込まれるシステム全体の設計に移っていそうです。
だからこそ私たちは、AIエージェントを「様々な業務で自律させる対象」というより、「業務や実システムの中で安全に運用するための設計対象」として捉える必要が出てきていると感じています。
AIの性能や自律性が高まるほど、人間の関心は「AIをどこまで賢くするか」だけではなく、「AIをどのような権限で動かすか」「どの情報を渡すか」「どこで人間が確認するか」「あとから検証できる形になっているか」といった、実行環境全体の設計へ向かっていきます。
開発者から見ると当たり前に聞こえるかもしれませんが、AIエージェントを「自律するAI」ではなく、「安全に、再現性高く、検証可能に働くAIシステム」として扱う場面は今後も増えていきそうです。
今後の発信について
今後も、Algomatic AIラボでは最新論文の解説を継続していく予定です。
一方で、今回のように一定期間に扱った論文をテーマごとにまとめ直すことで、単発の投稿だけでは見えにくい研究の流れも、定期的に整理して発信していきたいと考えています。
最新論文を追うこと × 一定期間ごとに振り返ること。この2つを組み合わせることで、読者のみなさんが個別の論文だけではなく、研究の方向性をつかみ、自分の試行や判断のソースとして活用していただけたら嬉しいです。
Posts by Algomatic_AILab x.com
Algomatic では一緒に働く仲間を募集しています
Algomatic は新体制に移行し、採用も強化中です。AIエージェントの研究動向を踏まえた事業開発・プロダクト開発を、複数のカンパニーで進めています。
様々な観点からAIに向き合いたい方、最新研究を追いながら現場のプロダクト開発していくことに関心がある方は、ぜひお気軽にカジュアル面談へ足を運んでいただけたら嬉しいです。
参考文献
- [1] Language Models that Think, Chat Better. https://arxiv.org/abs/2509.20357
- [2] Gemini Robotics 1.5 brings AI agents into the physical world. https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world
- [3] Buy it in ChatGPT: Instant Checkout and the Agentic Commerce Protocol. https://openai.com/index/buy-it-in-chatgpt
- [4] The anatomy of a personal health agent. https://research.google/blog/the-anatomy-of-a-personal-health-agent
- [5] VaultGemma: The world's most capable differentially private LLM. https://research.google/blog/vaultgemma-the-worlds-most-capable-differentially-private-llm
- [6] Project Vend: Phase two. https://anthropic.com/research/project-vend-2
- [7] Effective Context Engineering for AI Agents. https://anthropic.com/engineering/effective-context-engineering-for-ai-agents
- [8] Context Engineering for AI Agents: Lessons from Building Manus. https://manus.im/ja/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
- [9] Agent Learning via Early Experience. https://arxiv.org/abs/2510.08558
- [10] Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning. https://arxiv.org/abs/2511.16043
- [11] Toward Training Superintelligent Software Agents through Self-Play SWE-RL. https://arxiv.org/abs/2512.18552
- [12] SMART: Self-Aware Agent for Tool Overuse Mitigation. https://arxiv.org/abs/2502.11435
- [13] AdaSearch: Balancing Parametric Knowledge and Search in Large Language Models via Reinforcement Learning. https://arxiv.org/abs/2512.16883
- [14] LoLoongFlow: Directed Evolutionary Search via a Cognitive Plan-Execute-Summarize ParadigmongFlow. https://arxiv.org/abs/2512.24077
- [15] SopSophia: A Persistent Agent Framework of Artificial Lifehia. https://arxiv.org/abs/2512.18202
- [16] LLMCache: Layer-Wise Caching Strategies for Accelerated Reuse in Transformer Inference. https://arxiv.org/abs/2512.16843
- [17] Towards a Science of Scaling Agent Systems. https://arxiv.org/abs/2512.08296
- [18] Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline. https://arxiv.org/abs/2601.12307
- [19] Systematic debugging for AI agents: Introducing the AgentRx framework. https://microsoft.com/en-us/research/blog/systematic-debugging-for-ai-agents-introducing-the-agentrx-framework
- [20] Classifier Context Rot: Monitor Performance Degrades with Context Length. https://arxiv.org/abs/2605.12366
- [21] Is Vibe Coding Safe? Benchmarking Vulnerability of Agent-Generated Code in Real-World Tasks. https://arxiv.org/abs/2512.03262v1
- [22] Agent Skills in the Wild: An Empirical Study of Security Vulnerabilities at Scale. https://arxiv.org/abs/2601.10338
- [23] Reasoning Models Struggle to Control their Chains of Thought. https://arxiv.org/abs/2603.05706
- [24] How Good is Post-Hoc Watermarking With Language Model Rephrasing?. https://arxiv.org/abs/2512.16904
- [25] Mitigating hallucinations in healthcare LLMs with granular fact-checking and domain-specific adaptation. https://arxiv.org/abs/2512.16189
- [26] Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations. https://transformer-circuits.pub/2026/nla
- [27] Beyond Data Filtering: Knowledge Localization for Capability Removal in LLMs. https://arxiv.org/abs/2512.05648
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み