#aiエージェント のAIニュース
381件の記事
エージェント的群れは組織図の幻想である
AIエージェントの群れで組織の下層を置き換え、人間を管理者として残す「エージェント的群れ」という生産性のビジョンは、組織図にロボットを加えただけの幻想であると指摘。
メタAIセキュリティ研究者、OpenClawエージェントが自身の受信箱で暴走したと報告
AIセキュリティ研究者が、AIエージェントにタスクを任せた際に起こり得る問題について警告する投稿を公開。
同じモデルなのに、なぜCursorはClaude Codeに及ばないのか
同じClaudeモデルでも、CursorとClaude Codeでは性能に差がある。その原因は、コンテキスト管理、使用シナリオ、データフィードバックの構造的差異にある。プログラミングが「人がコードを書く」から「人がAgentにコードを書かせる」へ変化する中で、ネイティブCLIツールはIDEから派生したAgentよりも有利である。
カーソルエージェントが自身のコンピューターを制御可能に
クラウドエージェントは作成したソフトウェアを使用して変更を検証し、作業をデモンストレーションできるようになりました。
企業全体のチーム向けコワークとプラグイン
企業内の複数チームが共同作業を効率化するためのコワーク機能とプラグインの提供についての記事です。
OpenAI、コンサルティング大手4社と提携し企業向け展開を強化
OpenAIはコンサルティング大手4社と提携し、企業向けAIプラットフォーム「OpenAI Frontier AI agent」の導入促進を図る。
MetaのAI安全責任者、AIエージェントに誤って受信箱を削除される
MetaのAI安全責任者がAIエージェントの「初心者ミス」により受信箱を削除された事例。AIの安全性と制御の課題を示す。
AIエージェントが経済を破壊する可能性
Citrini Researchの未来予測レポートでは、AIエージェントの普及により失業率が倍増し、株式市場の総価値が3分の1以上下落する可能性が示唆されている。
サマー・ユエの引用
OpenClawに「行動前に確認」と指示したが、受信トレイを高速で削除するのを止められず、爆弾処理のようにMac miniに駆けつけた体験談。
マスターカードのAI決済デモが示すエージェント主導型コマース
マスターカードは、人間ではなくソフトウェアエージェントが購入を完了する「エージェンティックコマース」のデモを公開。AIが自律的に決済を行う未来の可能性を示した。
OpenAI、フロンティア・アライアンス・パートナーズを発表
OpenAIが企業向けに安全で拡張性のあるAIエージェント展開を支援する「フロンティア・パートナーズ」を発表。実証実験から本番導入への移行を促進。
OpenAI Codex製品責任者:コードは人間が書かなくなるが、より多くの構築者が生まれる
OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。
アンドレイ・カルパシーが「Claws」について語る
アンドレイ・カルパシーは、Mac Miniを購入し「Claws」をいじる体験についてツイートした。アップルストアの店員は「ホットケーキのように売れているが誰もが混乱している」と語った。
Amazon Quick AgentsがModel Context Protocol (MCP)で外部ツールを統合
Amazon QuickがModel Context Protocol (MCP)をサポートし、ユーザーが独自のMCPサーバーをホストしてアプリケーション機能をツールとして公開できる。Amazon QuickはMCPクライアントとして機能し、アクション実行、データアクセス、AIエージェント統合を可能にする。
コードモード:1,000トークンでエージェントにAPI全体を提供
Cloudflare APIの2,500以上のエンドポイントを、コードモードにより2つのツールと約1,000トークンに圧縮し、効率的なAIエージェント連携を実現。
スキルズナイト:69,000以上の方法でエージェントがより賢くなっている
shu DingがReactに関する知識を文書化したことが始まりで、現在は69,000以上のスキル、200万回のスキルCLIインストールを持つオープンスキルエコシステム「skills.sh」が急速に成長している。
新たなオープンウェイトリーダー、巨大AIの政治的影響力、病気の予測、高速推論
AIニュース:オープンウェイトAIの進展、巨大AI企業の政治的影響、病気予測技術、高速推論手法についての最新動向を紹介。
Notion CEO:エージェントが使えない製品に未来はない
Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。
IBMとUCバークレー、IT-BenchとMASTを用いてエンタープライズエージェントの失敗原因を診断
IBMとUCバークレーはIT-BenchとMASTというツールを開発し、企業向けAIエージェントが失敗する原因を分析・特定する手法を確立しました。
EVMbenchの紹介
OpenAIとParadigmがEVMbenchを発表。AIエージェントがスマートコントラクトの重大な脆弱性を検出・修正・悪用する能力を評価するベンチマークです。
2026年2月18日 社会的影響 実践におけるAIエージェントの自律性測定
2026年2月18日に、AIエージェントの自律性を実践的に測定する方法とその社会的影響について考察された。
Claude Sonnet 4.6の紹介
Claude Sonnet 4.6の新バージョンがリリースされました。AIモデルの性能向上と新機能を提供します。
アンソロピックとインフォシス、通信などの規制産業向けAIエージェント構築で協業
アンソロピックとインフォシスが、通信などの規制産業向けにAIエージェントを共同開発する協業を発表しました。
GitHub Agentic Workflowsでリポジトリタスクを自動化
GitHub Agentic Workflowsは技術プレビュー中で、GitHub Actions内のコーディングエージェントを使用して、トリアージ、ドキュメンテーション、コード品質などの自動化を構築できます。
CodexとClaudeによるすべてのためのカスタムカーネル
CodexとClaudeが提供するカスタムカーネルにより、あらゆるユーザーがAIモデルを自身のニーズに合わせて最適化できるようになります。
エージェント向けMarkdownの導入
オンラインコンテンツの発見方法が、従来の検索エンジンから構造化データを必要とするAIエージェントへ移行。人間だけでなくエージェントも第一級市民として扱い、HTMLを自動変換するMarkdown for Agentsを提案。
実践におけるOpenEnv:現実世界環境でのツール利用エージェントの評価
OpenEnvを実際の環境で使用し、ツールを活用するエージェントの性能を評価する研究についての記事です。
長期実行エージェントの研究プレビューを拡大
Cursorウェブアプリで、Ultra、Teams、Enterpriseユーザー向けに長期実行エージェントが利用可能になりました。
ハーネス・エンジニアリング:エージェントファーストの世界におけるCodexの活用
技術スタッフのRyan Lopopoloが、エージェントファーストの世界でCodexを活用するハーネス・エンジニアリングについて解説しています。
エージェントがサンドボックスを接続する2つのパターン
エージェントが安全な作業環境(サンドボックス)を接続する主要な2つの方法について説明する記事。
誰でもエージェントを構築できるが、実行にはプラットフォームが必要
AIモデルがコードとエージェント生成を一般化し、誰でも数分で高度なソフトウェアを構築できるようになった。しかし、プロトタイプ作成は民主化されたものの、本番環境へのデプロイは複雑でコストがかかる課題が残っている。
公開データの洞察を迅速に取得:Data Commons MCPがGoogle Cloudでホスト開始
Data CommonsがGoogle Cloud Platform上で無料のModel Context Protocolサービスを開始し、ユーザーはセットアップ不要で公開データの分析を迅速に行えるようになりました。
Software Design 連載「実録 AI ネイティブプロダクト開発」がスタートします!
LayerXによる新連載が開始。AIエージェントを実用化するための実践知を10回にわたり公開し、体験設計から運用監視まで網羅する。
LWiAIポッドキャスト #233 - Moltbot、Genie 3、Qwen3-Max-Thinking
GoogleがChromeにGemini AI搭載の自動ブラウズ機能を追加、ユーザーが常時稼働AIのオープンソースMoltbotに殺到、Qwen3-Max-Thinkingが登場など、最新AI動向を紹介。
スキルの評価
Dagsterスキルの効果を定量的に測定する軽量評価フレームワークを構築し、その結果を報告する。
AIエージェントが大規模言語モデルから最良の結果を得るための検索を支援
EnCompassはバックトラックと複数試行によりAIエージェントプログラムを実行し、LLMが生成する最適な出力セットを見つけます。これにより、コーダーがAIエージェントをより効率的に活用できるよう支援します。
実践的Continuous AI:エージェント型CIで開発者が今日から自動化できること
Continuous AIは、リポジトリ内で推論を必要とするタスクを実行するバックグラウンドエージェントとして機能し、開発プロセスの自動化を実現します。
自律型コードベースに向けて
マルチエージェント研究ハーネスの一部をプレビュー公開し、自律的なコード開発の実現を目指す取り組みを開始。
【2026年2月】AIエージェントのフレームワーク:いつ使う?どれを選ぶ?LangChain?Claude Agent SDK?
AIエージェント開発におけるフレームワーク(LangChain、Claude Agent SDK等)の選択基準と使用タイミングについて、アプリケーションの種類に応じた判断を解説。
AIエージェントキャッチアップ #66 - Agent Client Protocolを開催
エディターとコーディングエージェント間の通信を標準化する「Agent Client Protocol(ACP)」についての勉強会が開催されました。
DataOpsのループを閉じる:なぜ私たちがDagster+向けにCompassを構築したのか
検出はもはやボトルネックではなく、理解が課題です。CompassはDagster+の運用データを対話に変えることで、このループを閉じます。
構築、研究、共有学習を通じてAIコミュニティを活性化
AIの進歩には画期的なモデルだけでなく、実験や知識共有を行う構築者・研究者のコミュニティが不可欠であり、Amazonはこの考えに基づき開発者・研究者との関わりを深めている。
チャットボットを超えて:信頼できるAIのための青写真
Google開発者エキスパートチームがサンダーヒル・レースウェイパークで「信頼できるAIフレームワーク」をテストした。
フックでGemini CLIをあなたのワークフローに合わせる
Gemini CLI v0.26.0以降で導入されたフック機能により、エージェントループをカスタマイズできます。コンテキストの追加、ポリシーの適用、シークレットのブロックが可能になります。
AIエージェントキャッチアップ #65 - Open Responsesを開催
OpenAIのResponses APIをオープン仕様化した「Open Responses」についての勉強会を開催。GitHubリポジトリや公式ドキュメントを紹介。
AIエージェント向け、アジェンティック・ベリファイアを用いたマルチモーダル強化学習
Microsoft Researchチームは、医療画像レポート生成をスケーリングする「UniRG」を開発し、マルチモーダル強化学習とエージェント型検証機能を用いて精度を向上させた。
データ検索基盤チームの立ち上げ
LayerXがデータ検索基盤チームを新設。生成AI時代に差別化を図るため、非構造化データを活用し、汎用AIエージェントプラットフォームの構築を目指す。
AIエージェントキャッチアップ #64 - Universal Commerce Protocol 開催
Googleが発表したエージェンティックコマースのプロトコル「Universal Commerce Protocol(UCP)」についての勉強会を開催しました。
Claudeとプロパティベーステストを用いたバグ発見
大規模ソフトウェアプロジェクトで、コードの一般特性を推論してバグを効率的に特定するエージェントを開発した。
強化学習によるマルチターンAIエージェントのカスタマイズ
既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。