#aiエージェント のAIニュース

381件の記事

エージェント的群れは組織図の幻想である

AIエージェントの群れで組織の下層を置き換え、人間を管理者として残す「エージェント的群れ」という生産性のビジョンは、組織図にロボットを加えただけの幻想であると指摘。

Andrej Karpathy 厳選·2月24日·★★★★

メタAIセキュリティ研究者、OpenClawエージェントが自身の受信箱で暴走したと報告

AIセキュリティ研究者が、AIエージェントにタスクを任せた際に起こり得る問題について警告する投稿を公開。

TechCrunch AI·2月24日

同じモデルなのに、なぜCursorはClaude Codeに及ばないのか

同じClaudeモデルでも、CursorとClaude Codeでは性能に差がある。その原因は、コンテキスト管理、使用シナリオ、データフィードバックの構造的差異にある。プログラミングが「人がコードを書く」から「人がAgentにコードを書かせる」へ変化する中で、ネイティブCLIツールはIDEから派生したAgentよりも有利である。

宝玉的分享·2月24日·★★★★

カーソルエージェントが自身のコンピューターを制御可能に

クラウドエージェントは作成したソフトウェアを使用して変更を検証し、作業をデモンストレーションできるようになりました。

Cursor Blog·2月24日·★★★★

企業全体のチーム向けコワークとプラグイン

企業内の複数チームが共同作業を効率化するためのコワーク機能とプラグインの提供についての記事です。

Claude Blog·2月24日·★★★★

OpenAI、コンサルティング大手4社と提携し企業向け展開を強化

OpenAIはコンサルティング大手4社と提携し、企業向けAIプラットフォーム「OpenAI Frontier AI agent」の導入促進を図る。

TechCrunch AI·2月24日·★★★★

MetaのAI安全責任者、AIエージェントに誤って受信箱を削除される

MetaのAI安全責任者がAIエージェントの「初心者ミス」により受信箱を削除された事例。AIの安全性と制御の課題を示す。

404 Media·2月24日

AIエージェントが経済を破壊する可能性

Citrini Researchの未来予測レポートでは、AIエージェントの普及により失業率が倍増し、株式市場の総価値が3分の1以上下落する可能性が示唆されている。

TechCrunch AI·2月23日·★★★★

サマー・ユエの引用

OpenClawに「行動前に確認」と指示したが、受信トレイを高速で削除するのを止められず、爆弾処理のようにMac miniに駆けつけた体験談。

Andrej Karpathy 厳選·2月23日

マスターカードのAI決済デモが示すエージェント主導型コマース

マスターカードは、人間ではなくソフトウェアエージェントが購入を完了する「エージェンティックコマース」のデモを公開。AIが自律的に決済を行う未来の可能性を示した。

AI News·2月23日·★★★★

OpenAI、フロンティア・アライアンス・パートナーズを発表

OpenAIが企業向けに安全で拡張性のあるAIエージェント展開を支援する「フロンティア・パートナーズ」を発表。実証実験から本番導入への移行を促進。

OpenAI News·2月23日·★★★★

OpenAI Codex製品責任者:コードは人間が書かなくなるが、より多くの構築者が生まれる

OpenAI Codex責任者がAIコーディングの現状を語る。社内ではIDEを使わずCodex利用が20倍増。真の課題はモデルではなく人間の適応。オープン標準やエージェント市場の未来も議論。

宝玉的分享·2月22日·★★★★

アンドレイ・カルパシーが「Claws」について語る

アンドレイ・カルパシーは、Mac Miniを購入し「Claws」をいじる体験についてツイートした。アップルストアの店員は「ホットケーキのように売れているが誰もが混乱している」と語った。

Andrej Karpathy 厳選·2月21日

Amazon Quick AgentsがModel Context Protocol (MCP)で外部ツールを統合

Amazon QuickがModel Context Protocol (MCP)をサポートし、ユーザーが独自のMCPサーバーをホストしてアプリケーション機能をツールとして公開できる。Amazon QuickはMCPクライアントとして機能し、アクション実行、データアクセス、AIエージェント統合を可能にする。

AWS Machine Learning Blog·2月21日·★★★★

コードモード:1,000トークンでエージェントにAPI全体を提供

Cloudflare APIの2,500以上のエンドポイントを、コードモードにより2つのツールと約1,000トークンに圧縮し、効率的なAIエージェント連携を実現。

Cloudflare Blog·2月20日·★★★★

スキルズナイト:69,000以上の方法でエージェントがより賢くなっている

shu DingがReactに関する知識を文書化したことが始まりで、現在は69,000以上のスキル、200万回のスキルCLIインストールを持つオープンスキルエコシステム「skills.sh」が急速に成長している。

Vercel Blog·2月20日·★★★★

新たなオープンウェイトリーダー、巨大AIの政治的影響力、病気の予測、高速推論

AIニュース:オープンウェイトAIの進展、巨大AI企業の政治的影響、病気予測技術、高速推論手法についての最新動向を紹介。

The Batch·2月20日

Notion CEO:エージェントが使えない製品に未来はない

Notion CEOは、エージェントによるメール管理の経験やAIモデル中立の「スイス戦略」への転換を語り、製品はAIエージェント対応が必須と主張。

宝玉的分享·2月19日·★★★★

IBMとUCバークレー、IT-BenchとMASTを用いてエンタープライズエージェントの失敗原因を診断

IBMとUCバークレーはIT-BenchとMASTというツールを開発し、企業向けAIエージェントが失敗する原因を分析・特定する手法を確立しました。

Hugging Face Blog·2月19日·★★★★

EVMbenchの紹介

OpenAIとParadigmがEVMbenchを発表。AIエージェントがスマートコントラクトの重大な脆弱性を検出・修正・悪用する能力を評価するベンチマークです。

OpenAI News·2月18日·★★★★

2026年2月18日 社会的影響 実践におけるAIエージェントの自律性測定

2026年2月18日に、AIエージェントの自律性を実践的に測定する方法とその社会的影響について考察された。

Anthropic Research·2月18日·★★★★

Claude Sonnet 4.6の紹介

Claude Sonnet 4.6の新バージョンがリリースされました。AIモデルの性能向上と新機能を提供します。

Anthropic News·2月17日·★★★★

アンソロピックとインフォシス、通信などの規制産業向けAIエージェント構築で協業

アンソロピックとインフォシスが、通信などの規制産業向けにAIエージェントを共同開発する協業を発表しました。

Anthropic News·2月17日·★★★★

GitHub Agentic Workflowsでリポジトリタスクを自動化

GitHub Agentic Workflowsは技術プレビュー中で、GitHub Actions内のコーディングエージェントを使用して、トリアージ、ドキュメンテーション、コード品質などの自動化を構築できます。

GitHub Blog·2月13日·★★★★

CodexとClaudeによるすべてのためのカスタムカーネル

CodexとClaudeが提供するカスタムカーネルにより、あらゆるユーザーがAIモデルを自身のニーズに合わせて最適化できるようになります。

Hugging Face Blog·2月13日·★★★★

エージェント向けMarkdownの導入

オンラインコンテンツの発見方法が、従来の検索エンジンから構造化データを必要とするAIエージェントへ移行。人間だけでなくエージェントも第一級市民として扱い、HTMLを自動変換するMarkdown for Agentsを提案。

Cloudflare Blog·2月12日·★★★★

実践におけるOpenEnv:現実世界環境でのツール利用エージェントの評価

OpenEnvを実際の環境で使用し、ツールを活用するエージェントの性能を評価する研究についての記事です。

Hugging Face Blog·2月12日·★★★★

長期実行エージェントの研究プレビューを拡大

Cursorウェブアプリで、Ultra、Teams、Enterpriseユーザー向けに長期実行エージェントが利用可能になりました。

Cursor Blog·2月12日·★★★★

ハーネス・エンジニアリング:エージェントファーストの世界におけるCodexの活用

技術スタッフのRyan Lopopoloが、エージェントファーストの世界でCodexを活用するハーネス・エンジニアリングについて解説しています。

OpenAI News·2月11日·★★★★★

エージェントがサンドボックスを接続する2つのパターン

エージェントが安全な作業環境(サンドボックス)を接続する主要な2つの方法について説明する記事。

LangChain Blog·2月11日·★★★★

誰でもエージェントを構築できるが、実行にはプラットフォームが必要

AIモデルがコードとエージェント生成を一般化し、誰でも数分で高度なソフトウェアを構築できるようになった。しかし、プロトタイプ作成は民主化されたものの、本番環境へのデプロイは複雑でコストがかかる課題が残っている。

Vercel Blog·2月9日·★★★★

公開データの洞察を迅速に取得:Data Commons MCPがGoogle Cloudでホスト開始

Data CommonsがGoogle Cloud Platform上で無料のModel Context Protocolサービスを開始し、ユーザーはセットアップ不要で公開データの分析を迅速に行えるようになりました。

Google Developers AI·2月9日·★★★★

Software Design 連載「実録 AI ネイティブプロダクト開発」がスタートします!

LayerXによる新連載が開始。AIエージェントを実用化するための実践知を10回にわたり公開し、体験設計から運用監視まで網羅する。

LayerX Tech Blog·2月6日·★★★★

LWiAIポッドキャスト #233 - Moltbot、Genie 3、Qwen3-Max-Thinking

GoogleがChromeにGemini AI搭載の自動ブラウズ機能を追加、ユーザーが常時稼働AIのオープンソースMoltbotに殺到、Qwen3-Max-Thinkingが登場など、最新AI動向を紹介。

Last Week in AI·2月6日·★★★★

スキルの評価

Dagsterスキルの効果を定量的に測定する軽量評価フレームワークを構築し、その結果を報告する。

Dagster Blog·2月6日

AIエージェントが大規模言語モデルから最良の結果を得るための検索を支援

EnCompassはバックトラックと複数試行によりAIエージェントプログラムを実行し、LLMが生成する最適な出力セットを見つけます。これにより、コーダーがAIエージェントをより効率的に活用できるよう支援します。

MIT ML News·2月6日·★★★★

実践的Continuous AI:エージェント型CIで開発者が今日から自動化できること

Continuous AIは、リポジトリ内で推論を必要とするタスクを実行するバックグラウンドエージェントとして機能し、開発プロセスの自動化を実現します。

GitHub Blog·2月6日·★★★★

自律型コードベースに向けて

マルチエージェント研究ハーネスの一部をプレビュー公開し、自律的なコード開発の実現を目指す取り組みを開始。

Cursor Blog·2月5日·★★★★

【2026年2月】AIエージェントのフレームワーク:いつ使う?どれを選ぶ?LangChain?Claude Agent SDK?

AIエージェント開発におけるフレームワーク(LangChain、Claude Agent SDK等)の選択基準と使用タイミングについて、アプリケーションの種類に応じた判断を解説。

Generative Agents·2月5日

AIエージェントキャッチアップ #66 - Agent Client Protocolを開催

エディターとコーディングエージェント間の通信を標準化する「Agent Client Protocol(ACP)」についての勉強会が開催されました。

Generative Agents·2月4日

DataOpsのループを閉じる:なぜ私たちがDagster+向けにCompassを構築したのか

検出はもはやボトルネックではなく、理解が課題です。CompassはDagster+の運用データを対話に変えることで、このループを閉じます。

Dagster Blog·2月3日·★★★★

構築、研究、共有学習を通じてAIコミュニティを活性化

AIの進歩には画期的なモデルだけでなく、実験や知識共有を行う構築者・研究者のコミュニティが不可欠であり、Amazonはこの考えに基づき開発者・研究者との関わりを深めている。

Amazon Science·2月3日

チャットボットを超えて:信頼できるAIのための青写真

Google開発者エキスパートチームがサンダーヒル・レースウェイパークで「信頼できるAIフレームワーク」をテストした。

Google Developers AI·1月29日·★★★★

フックでGemini CLIをあなたのワークフローに合わせる

Gemini CLI v0.26.0以降で導入されたフック機能により、エージェントループをカスタマイズできます。コンテキストの追加、ポリシーの適用、シークレットのブロックが可能になります。

Google Developers AI·1月28日·★★★★

AIエージェントキャッチアップ #65 - Open Responsesを開催

OpenAIのResponses APIをオープン仕様化した「Open Responses」についての勉強会を開催。GitHubリポジトリや公式ドキュメントを紹介。

Generative Agents·1月27日

AIエージェント向け、アジェンティック・ベリファイアを用いたマルチモーダル強化学習

Microsoft Researchチームは、医療画像レポート生成をスケーリングする「UniRG」を開発し、マルチモーダル強化学習とエージェント型検証機能を用いて精度を向上させた。

Microsoft Research·1月21日·★★★★

データ検索基盤チームの立ち上げ

LayerXがデータ検索基盤チームを新設。生成AI時代に差別化を図るため、非構造化データを活用し、汎用AIエージェントプラットフォームの構築を目指す。

LayerX Tech Blog·1月20日·★★★★

AIエージェントキャッチアップ #64 - Universal Commerce Protocol 開催

Googleが発表したエージェンティックコマースのプロトコル「Universal Commerce Protocol(UCP)」についての勉強会を開催しました。

Generative Agents·1月19日

Claudeとプロパティベーステストを用いたバグ発見

大規模ソフトウェアプロジェクトで、コードの一般特性を推論してバグを効率的に特定するエージェントを開発した。

Anthropic Red Team·1月14日·★★★★

強化学習によるマルチターンAIエージェントのカスタマイズ

既存の環境シミュレータと検証可能な真実に基づく報酬関数を活用することで、小規模モデルと訓練データでもタスク成功率を向上できる。

Amazon Science·1月14日·★★★★