#自律エージェント のAIニュース
23件の記事
AI ラジオ司会者が示す、AI 単独運用の信頼性欠如
Andon Labs は人間を介さずに AI エージェントが事業を運営する実験を実施しており、その最新事例として Claude や ChatGPT など主要な AI モデルがそれぞれラジオ局を運営している。この実験は、AI を単独で運用することのリスクや信頼性の欠如を浮き彫りにした。
GoogleのAletheiaが完全自律的なエージェント型数学研究の最先端を前進
Googleは、Gemini 3 Deep Thinkを使用するAI「Aletheia」を発表した。AletheiaはFirstProofチャレンジで新規数学問題の6/10を解決し、IMO-ProofBenchで約91.9%を獲得し、人間の介入なしでの研究レベルの証明発見における大きな進展を示した。
OpenAIがCodexを常時稼働型のコーディングエージェントに進化させ、画面を監視する機能を追加
OpenAIは開発者向けツール「Codex」を大幅に拡張し、AIがMacを自律的に操作し、画像を生成し、設定を記憶し、数週間にわたり自律的にタスクを継続できるようにした。この動きはAnthropicのClaude Codeを直接標的としている。
Claude Codeのルーチン機能によりAIが自動でバグ修正やコードレビューを実行
AnthropicはClaude Codeに「ルーチン」機能を導入し、ユーザーのローカルマシンを必要とせずに自動でバグ修正、プルリクエストのレビュー、イベント対応を実行できるようにした。
プレゼンテーション:AIコーディングアシスタントの現状
Birgitta Böckelerが、AIエージェントが「雰囲気コーディング」を超えて洗練されたコンテキストエンジニアリングへ進化し、自律的なコード生成に必要な安全策を構築する方法について議論している。
階躍にはもう「純粋な人間」従業員がいない
階躍社は、AIを単なるツールではなくコアワークフローに組み込み、従業員全員がAIシステムを統括する体制を構築した。同社には既に数千のAIエージェントが従業員として存在する。
Sakana AI、「Ultra Deep Research」を立ち上げ、数週間分の戦略作業を自動化
Sakana AIは、最大8時間自律的に調査し完成した分析を提供するビジネス顧客向けAIアシスタント「Sakana Marlin」を発表した。このツールは数週間分の戦略作業を数時間に圧縮することを目的としており、現在ベータテスト中である。
プレゼンテーション:楽しみと利益のためのエージェント群の指揮
Adrian Cockcroftが、クラウドネイティブからAIネイティブ開発への移行を説明し、CursorやClaude Flowなどのツールを用いた自律エージェント群を管理する「ディレクターレベル」のアプローチを共有した。BDDやMCPサーバー、言語移植の実世界実験を議論し、AI駆動プラットフォームを構築するエンジニアリングの未来について述べた。
OpenAI、自律エージェントの基盤としてResponses APIを拡張
OpenAIは、開発者が自律的なワークフローを構築しやすくするため、Responses APIを拡張し、シェルツールのサポート、組み込みエージェント実行ループ、ホスト型コンテナワークスペース、コンテキスト圧縮、再利用可能なエージェントスキルを追加した。
Anthropicの自動モードはClaudeの監視不要を意味する
AnthropicがClaude向け自動モード機能を発表した。この機能は時間節約に役立つが、より多くの幻覚生成や低品質コードの原因となる可能性がある。
独自インフラでクラウドエージェントを実行する
企業が自社ネットワーク内でコードとツール実行を完全に保持できるセルフホスト型クラウドエージェントを提供する。
ポッドキャスト: [ビデオポッドキャスト] 混沌を伴わないエージェントシステム: 自律エージェントの初期運用モデル
Shweta VohraとJoseph Steinが、ソフトウェアシステムが自ら計画・行動・決定を始める際の変化を議論する。真のエージェント的ユースケースと従来の自動化を区別し、この新環境における境界・オーケストレーション・システム設計について考察する。
アンドレイ・カーパシー氏、測定可能な結果を持つAI研究において人間がボトルネックになっていると指摘
AI開発者のアンドレイ・カーパシー氏は、自律エージェントが自身のトレーニング設定を最適化し、20年の経験を持つ彼が見逃していた改善点を発見したと述べ、測定可能な結果を持つAI研究において人間がボトルネックになっていると主張した。
QCon London AIコーディングの現状:より高性能で高コスト、より危険なコーディングエージェント
ThoughtworksのAIコーディング責任者Birgitta Böckelerが、AIコーディング分野では自律型コーディングエージェントの使用が進む一方で、セキュリティリスクの増大とコスト上昇が主要な懸念事項だと指摘した。
Anthropic、新機能「チャンネル」でClaude Codeを常時稼働AIエージェントに進化
AnthropicはClaude Codeに「チャンネル」機能を追加し、CI結果やチャットメッセージなどの外部イベントを直接セッションに取り込むことで、端末操作者不在でも継続作業可能な常時稼働AIエージェントを実現した。
StripeのエンジニアがMinionsを導入、自律エージェントが週数千のプルリクエストを生成
Stripeのエンジニアが、LLMとCI/CDパイプラインを活用した自律コーディングエージェント「Minions」を導入し、Slackやバグ報告から週1300件以上の本番対応可能なプルリクエストを生成している。
AIソフトウェア開発の第三の時代
自律型クラウドエージェントがより大規模なタスクを長期間にわたって担当するようになり、AIソフトウェア開発の第三の時代が到来している。
Deepmind、AIが人間に雑務を割り当てるべきと提案 - 仕事のやり方を忘れないため
Deepmindは、AIが人間に時折雑務を割り当てることで、人間が仕事のやり方を忘れないようにすべきと提案しています。
Apple 推論と計画ワークショップ 2025
AppleがAIの推論と計画能力を向上させる研究を進めており、自律的なAIシステムの開発を目指している。
ローカルエージェント向けの安全なサンドボックスの実装
macOS、Linux、Windowsでエージェントサンドボックスを構築し、セキュリティを向上させながら中断を減らす方法について。
2026年2月1日 サイエンス誌:科学研究のための長期実行Claude
Anthropic社がClaude AIを科学研究向けに長期実行可能なバージョンを発表した。研究者が複雑な計算やシミュレーションを継続的に実行できるように設計されている。
AIエージェントがスマートコントラクトの脆弱性を発見
実際に攻撃されたスマートコントラクトを評価した結果、最新のAIモデルが知識カットオフ後の脆弱性を発見できることが示された。
許可プロンプトを超えて:Claude Codeのセキュリティと自律性を向上
Claude Codeの新しいサンドボックス機能により、ファイルシステムとネットワークの分離を実現し、許可プロンプトを減らしながらユーザーの安全性を高めています。