#agentic ai のAIニュース

139件の記事

エンタープライズ IT アジェンシータスクの初ベンチマーク「ITBench-AA」で最先端モデルも正答率50%未満

Artificial Analysis と IBM が共同開発した新ベンチマーク「ITBench-AA」において、最先端の AI モデルがエンタープライズ IT 業務タスクで 50% を下回るスコアしか記録できなかったと発表された。

Hugging Face Blog·5月28日·★★★★

Microsoft Copilot Cowork がファイル漏洩

Simon Willison は、Microsoft Copilot Cowork という製品がファイルを不正に持ち出す事例を報告し、エージェント型システムの設計における最大の課題は攻撃者によるデータ漏洩を防ぐことであると指摘した。

Simon Willison Blog·5月27日·★★★★

Gemini 3.5 Flash は速度面で優れたモデルである

Google が I/O デイで発表した Gemini 3.5 Flash は、特定の速度帯において最速の性能を発揮するモデルであり、高速処理が優先される用途では有力な選択肢となる。ただし、それ以外の場面では Opus 4.7 や GPT-5.5 に劣る可能性があると指摘されている。

The Zvi·5月23日·★★★★

Amazon Nova Act が HIPAA 適合サービスに認定される

AWS は、医療・生命科学分野向け AI エージェント「Amazon Nova Act」が HIPAA(医療保険の携帯性と責任に関する法律)の要件を満たす適合サービスとして正式に認定されたと発表した。これにより、機密性の高い患者情報の処理にも同製品を安全に導入できるようになる。

AWS Machine Learning Blog·5月22日·★★★★

AI エージェントによるインテリジェントな放射線科ワークフローの最適化

AWS は、従来のルールベースシステムが文脈を無視して診断遅延やコスト増を招く課題に対し、62 病院のデータ分析に基づき AI エージェントで症例割り当てを最適化する手法を発表した。

AWS Machine Learning Blog·5月22日·★★★★

MagenticLite、MagenticBrain、Fara1.5:小型モデル向けに最適化されたエージェント体験

Microsoft Research は、ブラウザとローカルファイルシステムを単一ワークフローで連携する「MagenticLite」アプリケーションを発表した。また、オーケストレーション用「MagenticBrain」とコンピューター操作用「Fara1.5」という小型モデルも紹介し、小型モデルによるエージェント機能の強化を図っている。

Microsoft Research·5月22日·★★★★

2026 年に AI エージェント型検索へ再構築、グーグルが発表

グーグルは 2026 年までに検索機能を AI エージェント型に再構築する方針を明確化し、同社最高責任者が「検索は AI 検索である」と宣言した。

Ars Technica AI·5月21日·★★★★★

ジェミニ 3.5 Flash は生成 AI が実用的になるのに十分な速度を持つ可能性

Google は本日、最新モデル「Gemini 3.5 Flash」を自社製品群へ順次展開し、前世代の Pro モデルより性能が向上したと主張している。

Ars Technica AI·5月20日·★★★★

Gemini の新機能はスマホ操作の制御に焦点

Google は Android イベントで Gemini の新機能を発表し、Chrome や自動入力、アプリ内などでの利用を強化してユーザーに代わってスマホを操作する能力を高めた。

The Verge AI·5月13日

本日は特に目立った出来事なし

AIニュース配信元「AINews」は、2026年5月11日から12日にかけて複数のコミュニティを調査したが、業界に大きな影響を与える新発表や技術進展は見られなかった。

Smol AI News·5月12日·★★★★

AI Gateway の生産性インデックス

Vercel が提供する AI Gateway は、数百のモデルにまたがる実アプリケーションやエージェントを通じて、毎週新モデルが発表される業界において、実際の稼働負荷に基づいた独自の指標を示している。Anthropic が単価の高さにもかかわらず支出で首位を維持し、Google がリードする状況が確認された。

Vercel Blog·5月12日·★★★★

GitLab の「AGENT エラ」に向けた人員削減と構造的・戦略的見直しに関する考察

GitLab は AGENT エラへの対応として、小規模チームが存在する国の数を最大 30% 削減する方針を表明し、組織構造の再編と戦略的な意思決定を進めている。

Simon Willison Blog·5月12日·★★★★

OpenAI Codex が macOS および Windows の Chrome で直接動作可能に

OpenAI は、Codex を macOS と Windows の Chrome ブラウザで直接利用可能にする機能を公開した。この機能は背景で並列処理を行い、ブラウザを乗っ取らずに構造化ページや複雑なデータフローの反復作業をコード生成によって自動化する。

TLDR AI·5月8日·★★★★

クラウドフレア、世界で1,100人以上の人員削減を発表

クラウドフレアは、働き方が根本的に変化したとして、AI ツールやプラットフォームの開発・販売に注力するため、グローバルで1,100 人以上の従業員を削減する方針を決定した。

Cloudflare Blog·5月8日·★★★★

「正解」が非確定的な場合の自律型エージェント行動の検証

GitHub Copilot Coding Agent(Agent Mode)のような自律型エージェントは、UI やブラウザとの相互作用により正解が複数経路に分かれるため、従来の反復可能性を前提としたテスト手法では不十分である。

GitHub Blog·5月7日·★★★★

英国の数学者が AI エージェントにクレジットカードを任せる実験、パスワード漏洩や CAPTCHA の混乱など示す

イギリスの数学者ハンナ・フライ教授は、AI エージェントに銀行カード番号を与えてタスクを実行させる実験を行い、パスワードの漏洩や CAPTCHA の混乱などのリスクを示した。

The Register AI/ML·5月5日·★★★★

AI推論には異なるルールが適用される

NVIDIAのジェンソン・フアンCEOは、世界経済の主要出力がソフトウェアから知能へと移行する「AIファクトリー」時代に入ったと宣言した。しかし、アジェンティックAIが求める要件に対応できるクラウドストレージアーキテクチャはまだ設計されていない。

The Register AI/ML·5月5日·★★★★

TeamViewer ONE が IT 運用を消火活動から自動操縦へ変革

TeamViewer は、エージェント型 AI を搭載した「TeamViewer ONE」を発表し、技術的な問題が顕在化する前に検知・解決する仕組みを導入することで、IT チームの対応時間を大幅に短縮し、運用を自動化する。

The Register AI/ML·5月4日

Five Eyes 諸国が「自律型 AI の急展開は危険」と警告

米英豪加新の情報セキュリティ機関は、自律型 AI が誤動作し組織の脆弱性を増幅する恐れがあるとして、生産性よりレジリエンスを優先し、慎重な導入を推奨した。

The Register AI/ML·5月4日·★★★★

AI がカオスの要因に、CIO の役割変革へ

Forrester は、組織内で AI エージェントが暴走し混乱を招くため、CIO が秩序を守る管理者として新たな役割を担うと予測している。

The Register AI/ML·5月1日·★★★★

テナントに追従する耐久性実行を実現する「Dynamic Workflows」の発表

クラウドflare は、開発者向けプラットフォーム「Workers」において、テナントごとに動作ロジックを動的に実行できる新機能「Dynamic Workflows」を発表した。これにより、AI が実装を作成するアプリケーションや、マルチテナント SaaS の顧客ごとのビジネスロジックをランタイムで安全に処理できるようになる。

Cloudflare Blog·5月1日·★★★★

Amazon Athena と Amazon QuickSight を活用した Amazon SageMaker 上のエージェント型 AI アナリティクスの実現

Amazon は、大規模な構造化・非構造化データから迅速に洞察を得るため、Amazon SageMaker でエージェント型 AI アナリティクスを可能にするアーキテクチャを発表しました。これにより、SQL やデータモデリングの専門知識がなくても意思決定を加速できます。

AWS Machine Learning Blog·5月1日·★★★★

AWS キーノートは AI を魔法のように称賛するが、同社のエンジニアたちは異なる現実を語る

アマゾンのスティーブ・タルツァ氏は、自チームの目的として開発者のスピード向上と摩擦削減を挙げた。しかし、AI 活用が進む中でも、人間による最終確認なしに何もリリースしないという原則は不変であると明言した。

The Register AI/ML·4月29日·★★★★

24/7 シミュレーションループ:エージェント型 AI が地下資源工学を推進する方法

NVIDIA は、地下資源業界のデジタル進化において、専門家の作業を支援する 24 時間稼働型のシミュレーションループを実現するエージェント型 AI の重要性について解説している。

NVIDIA Developer Blog·4月29日·★★★★

GitHub Copilot、2026年6月より従量制課金へ移行

GitHubは2026年6月1日、Copilotの全プランを従量制課金へ移行すると発表した。月額枠のAIクレジットで利用でき、追加購入も可能。トークン消費量に基づき算出され、実際の使用量に連動した価格体系となる。

GitHub Blog·4月28日·★★★★

エージェント型自動化のスケーラビリティ実現へ

WorkHQは、断片化したシステム間での通信不全を解消し、AIエージェントと人間が連携する本格的な業務自動化の実現を目指す。既存の自動化レイヤーを統合し、スケーラブルなマルチエージェントワークフローの実用化を約束する。

The Register AI/ML·4月27日

VisierとAmazon Quickを用いた workforce AIエージェントの構築

VisierとAmazon Quickは、組織の人事・パフォーマンスデータを統合する workforce AIエージェントを構築し、従業員が迅速な意思決定を行えるよう支援する。

AWS Machine Learning Blog·4月25日·★★★★

Meta、Amazonから数千万個のAWS Graviton 5プロセッサコアを購入

MetaはAmazonから数千万個のAWS Graviton 5プロセッサコアを購入し、Graviton最大の顧客の一つとなる。

The Decoder·4月24日·★★★★

エージェント型AIの普及で競合が価格引き上げと利用制限を強める中、Deepseekはほぼ無料の十分品質モデルをリリース

中国のDeepseekは、最大1.6兆パラメータを持つV4-ProとV4-Flashをリリースした。競合より大幅に低価格で提供し、技術論文で学習データやハードウェアの詳細を公開した。

The Decoder·4月24日·★★★★

【AIニュース】GPT-5.5とOpenAI Codexのスーパーアプリ化

OpenAIはGPT-5.5をリリースし、コスト対性能比でOpus 4.7と同等の成果を示した。AAはこれを世界最高レベルのモデルと認定し、コーディング能力以外の総合知能において首位に位置付けた。

Latent Space·4月24日·★★★★

OpenAI、GPT-5.5を発表、「新クラスの知能」を謳うもAPI料金は倍額

OpenAIは複数のツールを切り替えて複雑なタスクを自律的に処理するエージェント型モデル「GPT-5.5」を発表した。API料金は従来比2倍となっている。

The Decoder·4月24日·★★★★

Google、競合も受け入れるオールインワンAIスタックの理由を説明

Google Cloudのアнди・グトマンズ氏は、同社がクラウドインフラ、最先端AIモデル、データプラットフォームを統合する唯一の提供者であり、企業向けAIエージェント市場で構造的優位性を持つと主張した。

The Register AI/ML·4月24日·★★★★

Grafana、LokiをKafka基盤に再設計しコーディングエージェント向け観測CLIをリリース

グラファナラボスはGrafana 13を発表した。LokiをKafka基盤に再設計し、AI監視機能を搭載する。また開発エージェント向け新CLI「GCX」も提供した。

InfoQ·4月23日·★★★★

Google、Cloud Next '26で第8世代TPU、エージェントプラットフォーム、Workspace AIレイヤーを発表

GoogleはCloud Next '26で、第8世代TPU、エージェントプラットフォーム、Workspace用AIレイヤーを発表し、「Agentic Enterprise」戦略を推進している。

The Decoder·4月23日·★★★★

スタートアップ企業がAIへの支出を人間従業員の給与より多く自慢している

スタートアップ企業の経営者は、AIインフラへの支出を人間従業員の給与より多くすることを誇示し、高額な請求書を企業の成長指標として自慢している。

404 Media·4月22日·★★★★

エージェント時代のための2つの専用TPUを発売

Googleは、AIの未来を支える第8世代TPUとして2つの専用チップを発表した。これらは「エージェント時代」に対応し、次世代AIの基盤となるハードウェアとして機能する。

Google AI Blog·4月22日·★★★★

Gemini Agent Platform、企業のデプロイメント課題に対応

Googleは「Gemini Agent Platform」を提供し、企業がエージェント型AIを業務環境に安全かつ適切に展開する際の課題を解決することを目指す。

AI Business·4月22日·★★★★

アジェンティック・エンジニアリング:AIエージェントの群れがソフトウェアエンジニアリングを再定義する方法

LangGraphに基づくマルチエージェントシステムは、実際のエンジニアリングチームを模倣し、デバッグ時間を93%削減し、クロスチームの納期を圧縮する。

LangChain Blog·4月22日·★★★★

私のエージェントがまたツールを誤操作した!

通義实验室はAgentic AI向け自動最適化エンジン「AgentScope Tuner」を開発した。同エンジンはエージェントのAPI誤操作やルール変更を自動調整し、静的デプロイメントの問題を解決する。

通义大模型·4月21日

「GitHub Copilot 個人向けプランの変更」

GitHubは、エージェント型ワークフローによる計算リソース増大を受け、個人向けプランの新規登録停止・利用制限強化・モデル変更を実施すると発表した。

GitHub Blog·4月21日·★★★★

エージェント環境における間接AGENTS.mdインジェクション攻撃の対策

AI開発ツールの普及に伴い、NVIDIAはAGENTS.mdファイルを用いた間接インジェクション攻撃への対策手法を提示している。

NVIDIA Developer Blog·4月21日·★★★★

Amazon Bedrock AgentCoreとNova 2 Sonicを活用したマルチチャネル注文システム

Amazonは、Bedrock AgentCoreとNova 2 Sonicを用いた音声対応マルチチャネル注文システムの構築手法を公開する。双方向音声処理、文脈維持、バックエンド連携、高負荷スケーリングを実現する。

AWS Machine Learning Blog·4月21日

数時間から数分へ:エージェント型AIがマーケターに重要な業務の時間を取り戻す方法

AWSマーケティングのTAAチームがGradialと協力し、エージェント型AIを活用して、ページ作成や調整メールなどの手動ワークフローを自動化し、マーケティングチームが顧客の問題特定やキャンペーン構築など重要な業務に集中できるようにした。

AWS Machine Learning Blog·4月18日·★★★★

RobloxのAIアシスタントが、ゲームを計画・構築・テストするための新しい自律的ツールを獲得

Robloxが、AIアシスタントにゲーム開発プロセス全体を支援する新しい自律的ツールを追加した。

TechCrunch AI·4月17日·★★★★

本日は特に目立った出来事なし

2026年4月14日から15日にかけてのAIニュースを、12のサブレッドと544件のツイートを調査した結果、特筆すべき大きな出来事は確認されなかった。

Smol AI News·4月15日·★★★★

NotionのToken Town:5つの再構築、100以上のツール、MCP対CLI、そしてソフトウェアファクトリーの未来 — NotionのSimon Last & Sarah Sachs

Notionは、ChatGPT以前からAIツールを開発し、2023年のQ&A、2024年の統合AI、2025年の会議ノートで成功を収めた。Ryan Nystromが予告したNotion 3.0のカスタムエージェントを正式に採用し、Sarah SachsとSimon Lastがその構築プロセスについて解説している。

Latent Space·4月15日·★★★★

Spring AI SDK for Amazon Bedrock AgentCoreが一般提供開始

AmazonがBedrock AgentCore向けSpring AI SDKを一般公開した。これにより、組織は生成AIを単なるプロンプト応答から、複雑な多段階タスクを自律的に計画・実行・完了するエージェント型AIシステムへ進化させられる。

AWS Machine Learning Blog·4月14日·★★★★

トークン億万長者のための極限ハルネスエンジニアリング:100万行コード、日量10億トークン、人間コード・レビューゼロ

OpenAIのRyan Lopopolo氏が「ハルネスエンジニアリング」を提唱。100万行のコードと日量10億トークンを処理し、人間によるコーディングやレビューを排除する新アプローチを発表。AIE Europeでの基調講演で注目を集めている。

Latent Space·4月8日·★★★★

Gemma 4とオープンモデルの成功要因

著者は、2026年におけるGemma 4の公開モデル評価が困難な理由を分析する。過去のLlamaやQwenシリーズとの比較を通じて、オープンモデルが成功し研究コミュニティを活性化させるための条件について考察している。

Interconnects·4月4日·★★★★

AIモデルは人間設計の構成要素なしではロボット制御に失敗するが、エージェント的足場がギャップを埋める

Nvidia、UCバークレー、スタンフォード大学の研究チームは、AIモデルがコードを通じてロボットを制御する能力を体系的にテストした。人間設計の抽象化がなければ最先端モデルでも失敗するが、テスト時計算スケーリングなどの手法がギャップを埋めることを発見した。

The Decoder·4月2日·★★★★