#自律エージェントのAIニュース

23件の記事

AI ラジオ司会者が示す、AI 単独運用の信頼性欠如

Andon Labs は人間を介さずに AI エージェントが事業を運営する実験を実施しており、その最新事例として Claude や ChatGPT など主要な AI モデルがそれぞれラジオ局を運営している。この実験は、AI を単独で運用することのリスクや信頼性の欠如を浮き彫りにした。

The Verge AI·5月16日

GoogleのAletheiaが完全自律的なエージェント型数学研究の最先端を前進

Googleは、Gemini 3 Deep Thinkを使用するAI「Aletheia」を発表した。AletheiaはFirstProofチャレンジで新規数学問題の6/10を解決し、IMO-ProofBenchで約91.9%を獲得し、人間の介入なしでの研究レベルの証明発見における大きな進展を示した。

InfoQ·4月19日·★★★★

OpenAIがCodexを常時稼働型のコーディングエージェントに進化させ、画面を監視する機能を追加

OpenAIは開発者向けツール「Codex」を大幅に拡張し、AIがMacを自律的に操作し、画像を生成し、設定を記憶し、数週間にわたり自律的にタスクを継続できるようにした。この動きはAnthropicのClaude Codeを直接標的としている。

The Decoder·4月17日·★★★★

Claude Codeのルーチン機能によりAIが自動でバグ修正やコードレビューを実行

AnthropicはClaude Codeに「ルーチン」機能を導入し、ユーザーのローカルマシンを必要とせずに自動でバグ修正、プルリクエストのレビュー、イベント対応を実行できるようにした。

The Decoder·4月15日·★★★★

プレゼンテーション：AIコーディングアシスタントの現状

Birgitta Böckelerが、AIエージェントが「雰囲気コーディング」を超えて洗練されたコンテキストエンジニアリングへ進化し、自律的なコード生成に必要な安全策を構築する方法について議論している。

InfoQ·4月8日

階躍にはもう「純粋な人間」従業員がいない

階躍社は、AIを単なるツールではなくコアワークフローに組み込み、従業員全員がAIシステムを統括する体制を構築した。同社には既に数千のAIエージェントが従業員として存在する。

阶跃星辰·4月3日·★★★★

Sakana AI、「Ultra Deep Research」を立ち上げ、数週間分の戦略作業を自動化

Sakana AIは、最大8時間自律的に調査し完成した分析を提供するビジネス顧客向けAIアシスタント「Sakana Marlin」を発表した。このツールは数週間分の戦略作業を数時間に圧縮することを目的としており、現在ベータテスト中である。

The Decoder·4月3日

プレゼンテーション：楽しみと利益のためのエージェント群の指揮

Adrian Cockcroftが、クラウドネイティブからAIネイティブ開発への移行を説明し、CursorやClaude Flowなどのツールを用いた自律エージェント群を管理する「ディレクターレベル」のアプローチを共有した。BDDやMCPサーバー、言語移植の実世界実験を議論し、AI駆動プラットフォームを構築するエンジニアリングの未来について述べた。

InfoQ·4月2日·★★★★