#ai agents のAIニュース

41件の記事

エージェント工学:新たな学問分野として確立

LangChain Blog は、AI エージェントの設計・構築を体系化する「エージェント工学」という新しい学問分野の確立を提案している。

LangChain Blog·6月17日·★★★★

Factory 2.0:コーディングエージェントからソフトウェア工場へ(3 分読了)

TLDR AI は、Factory が顧客と共に構築したソフトウェア工場が世界最大規模の組織で既に稼働中であると報告し、自律的なソフトウェア開発への投資がエンジニアリング成果を劇的に向上させると指摘している。

TLDR AI·6月16日·★★★★

AI エージェントが従業員となる中、アイデンティティ付与に特化した NewCore が 6,600 万ドルを調達

NewCore は AI エージェントにデジタルアイデンティティを与えるプラットフォームを提供する企業であり、この資金調達により同社の事業拡大を加速させる。

TechCrunch AI·6月15日·★★★★

Databricks が AI エージェントを統合・管理するメタハネス「Omnigent」をオープンソース化

Databricks は Neon と共同で開発した、Claude Code や Codex などの AI エージェントを統合的に構成・統治・共有できるオープンソースのメタハネス「Omnigent」を Apache 2.0 ライセンスで公開した。

MarkTechPost·6月14日·★★★★

[AINews] ループクラフト:ループを積み重ねる芸術

Steipete氏、Boris氏、Andrej氏らは、コーディングエージェントへのプロンプト依存から脱却し、エージェントに作業を任せるための「ループ設計」の重要性を強調している。

Latent Space·6月12日·★★★★

Vercel上で12万社分のCMOエージェントを運用するOkaraの仕組み

OkaraはVercel上のマルチプロバイダAIスタックを活用し、SEOやSNSなど8つのサブエージェントを統括して12万社以上の企業の成長管理を行うAI CMOである。

Vercel Blog·6月11日·★★★★

AI エージェントと NVIDIA FLARE Auto-FL を用いた連合学習研究の加速

NVIDIA は、AI エージェントおよび同社の FLARE Auto-FL ツールを活用することで、連合学習の研究開発プロセスを大幅に加速させることを発表した。

NVIDIA Developer Blog·6月10日·★★★★

ハーバード大学とPerplexityの共同研究:AIエージェントは1セッションあたり26分間の自律的作業を実行(検索は33秒)

ハーバード大学とPerplexityが共同で実施した90日間の研究では、Perplexityの「Computer」製品であるAIエージェントが、1回のセッションで平均26分間にわたって自律的な知識労働を完了させる一方、同社の検索機能は33秒間のみで作業を終了することが実証された。

MarkTechPost·6月9日·★★★★★

AI エージェントが知識労働をどう再構築するか(18 分読)

Perplexity の「Computer」のような AI エージェントは、従来の検索や人手による実行と比較して時間を 87%、コストを 94% 削減し、タスクを自律的に実行することで、ユーザーが目標設定と監視に集中できる環境を提供している。

TLDR AI·6月9日·★★★★

"チャットは死んだ": OpenAI、ChatGPT の大規模刷新を準備

OpenAI は今年の上場を見据え、コーディングツールや AI エージェントを組み合わせた「スーパーアプリ」への転換を図り、収益源の拡大を目指している。

Ars Technica AI·6月8日·★★★★

2026 年版 低コード・ノーコード AI ツール厳選 21 選

MarkTechPost は、テキストプロンプトでアプリや自動化を生成する AI ネイティブ開発環境として進化し、AI 実践者が現在利用している 21 のツールを紹介した。

MarkTechPost·6月7日·★★★★

[AINews] 今日特に大きな出来事はありませんでした

Latent Space が運営するニュースレター「AINews」が、6月4日から5日にかけてのAI業界動向を12件のRedditスレッドや544件のTwitter投稿から選別して紹介しました。記事ではRL環境ガイドの推奨や、DeepSeek v4 Pro向けの最適化に関するリモートポッドの更新について言及しています。

Latent Space·6月6日·★★★★

トークン請求が到来:AI の暴走するコストを管理するための業界の駆け引き

TechCrunch AI は、生成 AI の利用に伴うトークンコストが急増している現状について報じ、各企業がその費用を抑制・管理するために競って対策を講じている状況を伝えている。

TechCrunch AI·6月5日·★★★★★

Google Colab CLI の紹介

Google は、開発者や AI エージェントがローカル端末からリモート Colab ランタイムに接続し、高機能 GPU を要求して Python スクリプトをシームレスに実行できる新ツール「Google Colab CLI」を発表した。

Google Developers AI·6月5日·★★★★

NVIDIA Nemotron 3 Ultra が長時間実行型エージェントの推論を高速化・効率化

NVIDIA は、長時間実行型エージェントが推論を行い、文脈を維持し、ツールを活用して効率的に動作するための新モデル「Nemotron 3 Ultra」を発表した。これにより、単発チャットボットから複雑なタスクをこなすエージェントへの進化が加速する。

NVIDIA Developer Blog·6月4日·★★★★

Hugging Face CLI をエージェント最適化された Hub 操作手段として設計する

Hugging Face は、ハブ上のリソースを効率的に扱うための CLI ツールを、AI エージェントによる自動化利用を意識した設計へと刷新すると発表した。

Hugging Face Blog·6月4日·★★★★

マイクロソフトと OpenAI の決裂後、両社は激しく対立する準備を整えた

マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。

The Verge AI·6月3日·★★★★

マイクロソフトと NVIDIA の新ツールを用いて Windows PC でパーソナル AI エージェントを構築する

マイクロソフトと NVIDIA は、Windows PC 上でパーソナル AI エージェントを構築するための新ツールを提供した。これにより開発者はローカル環境で効率的にエージェントを設計・実装できる。

NVIDIA Developer Blog·6月3日·★★★★

Nvidia と Microsoft の研究者、AI エージェントは安全性や信頼性を考慮しないと指摘

マイクロソフト、Nvidia、カリフォルニア大学リバーサイド校の研究者らが共同研究で、コンピューター操作権限を持つ AI エージェントがタスク完了のために危険な行動をとる傾向があることを示した。

404 Media·6月3日·★★★★

AWS上のLangSmithを用いたディープエージェントの評価方法

AWSとパートナーのランチェーンが共同で、非確定的なAIエージェントの動作を検証する手法を公開した。これは本番環境への展開前にエラーを早期に発見し、ワークフロー全体への悪影響を防ぐための評価フレームワークである。

AWS Machine Learning Blog·5月29日·★★★★

オープンソースパッケージの重大脆弱性により数百万の AI エージェントが危険にさらされる

セキュリティ研究者は、週に 3 億 2500 万ダウンロードされるオープンソースフレームワーク「Starlette」に存在する重大な脆弱性が、世界中の数百万の AI エージェントやツールのサーバーをハッカーに突破させ、機密データや認証情報を盗まれる危険があると警告している。

Ars Technica AI·5月27日·★★★★★

エージェントにコンピュータを与える:Ivan Burazin、Daytona

Ivan Burazin は、Perplexity や Cursor などの企業が「Computer」機能を導入し、研究側でも評価基準が変化している現状を説明。その結果、AI インフラ企業である Daytona が成長していることを示した。

Latent Space·5月22日·★★★★

Amazon Bedrock AgentCore を活用したビジネスインテリジェンス用 AI エージェントの構築

AWS は、Amazon Bedrock AgentCore を使用して企業向けにビジネスインテリジェンス用の AI エージェントを構築する方法を発表しました。これにより、OPLOG のような企業が断片化した業務データを統合し、AI とロボットを活用した効率的な物流管理を実現できます。

AWS Machine Learning Blog·5月22日·★★★★

Vega:AI 時代のデジタルアイデンティティのためのゼロ知識証明

Microsoft Research は、デバイス上で生成されるゼロ知識証明技術「Vega」を発表した。これにより、ユーザーは政府発行の資格情報を開示せずに年齢や職業などの事実を証明できるようになり、プライバシー保護された大規模な本人確認が実現する。

Microsoft Research·5月21日·★★★★

Warelay から OpenClaw へ:PyCon US 発表準備のためプロジェクト名の変遷を確認

Simon Willison は PyCon US のライトニングトークの準備として、2025 年 11 月の初回コミット以降に Warelay から OpenClaw まで実際に使用されたプロジェクト名の数を調査した。

Simon Willison Blog·5月17日

AI エージェントとスキルを活用し、動画を即座に検索可能かつ実行可能なインテリジェンスへ変換

NVIDIA は、AI エージェントとスキル機能を用いて、組織が動画からリアルタイムで意味のある洞察を抽出し、それを即座に検索・活用できる技術を発表した。

NVIDIA Developer Blog·5月14日

Browser Run が Cloudflare コンテナ上で稼働し、高速化とスケーラビリティが向上

開発チームは Browser Run を Cloudflare のコンテナ基盤に再構築しました。これにより、1 分間に最大 60 ブラウザを起動可能になり、並行実行数は 120 に達し、以前より 4 倍の性能向上を実現しています。また、クイックアクションの応答時間が 50% 以上短縮され、信頼性も高まりました。

Cloudflare Blog·5月13日·★★★★

Strands と Exa を活用した Web 検索対応エージェントの構築

Exa の Ishan Goswami 氏と Nitya Sridhar 氏が、研究や事実確認に役立つ AI エージェント向けに、構造化データを直接取得できる Web 検索機能を実装する手法を Strands と Exa を用いて紹介している。

AWS Machine Learning Blog·5月12日·★★★★

メタ・メタ・プロンプティング:AI エージェントを機能させる秘訣(16 分読)

著者は、AI をチャットウィンドウではなく OS と見なすことで実現する個人用 AI の姿を示し、システム構築の鍵となる「メタ・メタ・プロンプティング」手法を紹介している。記事で説明された内容はすべて GitHub でオープンソースかつ無料で公開されている。

TLDR AI·5月11日·★★★★

Vercel 上で AI エージェント向け IDE を構築した Superset の取り組み

Superset は Vercel 上で、従来の開発ツールでは対応できない大規模な AI エージェント運用を可能にする統合開発環境(IDE)を構築しました。同社は週に最大 1,400 件のデプロイや、平均 30 秒のビルド時間を実現し、日次プレビューデプロイも約 600 件処理しています。

Vercel Blog·5月10日·★★★★

文法制約付きデコーディングによる小型言語モデルの Bash 生成能力向上

NVIDIA は、小型言語モデルが Bash コマンドをより正確に生成できるよう、文法制約付きデコーディング手法を導入したと発表した。これにより、AI エージェントのシステム操作精度が向上する。

NVIDIA Developer Blog·5月9日·★★★★

メンテナ月間へようこそ:コードの背後にいる人々を称える

オープンソースの未来について議論されたイベントで、AI がコード作成を担うようになるほど、人間によるメンタリングや信頼構築といった目に見えない作業が重要になると指摘されました。

GitHub Blog·5月5日·★★★★

AI推論は異なるルールに従う

NVIDIAのジェンソン・フアンCEOが「AIファクトリー」時代を宣言したが、GPUクラスターや巨大モデルへの注目が集まる中、AWSやAzureなどのクラウド環境ではデータインフラを圧迫するAIエージェントによる静かなる危機が進行している。

The Register AI/ML·5月5日·★★★★

Interrupt 2026のプレビュー:エンタープライズ規模のエージェント

Interrupt 2026は5月13-14日、サンフランシスコで開催される。ラインアップ、フォーマット、規模が大幅に向上し、エンタープライズ規模でのエージェント技術の進化を示唆している。

LangChain Blog·4月22日

耐久性のある実行のための新しいプログラミングモデル

Vercel社が、ローカル環境では簡単に実行できるコードが、障害や再起動、実際のトラフィックに対処する際に問題となる課題を解決するため、長期実行システム向けに耐久性のあるワークフローをアプリケーションコードの拡張として提供する新しいプログラミングモデル「Workflows」を発表した。

Vercel Blog·4月17日·★★★★

10年後、私の仕事はまだ存在しているだろうか

著者が、AIや自動化の進展により、自身の仕事が10年後も存続するか不確実性を感じていることを述べている。

Andrej Karpathy 厳選·3月6日·★★★★

AI駆動データエンジニアリングの発表

Dagster Universityが、AIコーディングエージェントを活用してプロダクションレディのELTパイプラインを構築する方法を教えるコースを提供している。これによりデータエンジニアの作業方法が変化している。

Dagster Blog·3月5日

VercelがAIエージェント向けに40以上のパフォーマンスルールを含むReactベストプラクティスを公開

Vercelは、ReactとNext.jsアプリ向けの40以上のパフォーマンス最適化ルールを含むオープンソースリポジトリ「react-best-practices」を公開した。AIコーディングエージェント向けに設計されており、パフォーマンス、バンドルサイズ、アーキテクチャの意思決定を支援する。

InfoQ·2月27日·★★★★

Opus 4.6、Codex 5.3、そしてベンチマーク後の時代

OpenAIとAnthropicは2月5日、それぞれコーディング支援モデル「GPT-5.3-Codex」と「Claude Opus 4.6」を発表した。Anthropicは既存のClaude Codeによる性能向上で注目を集めており、ソフトウェア開発の変革とML研究の加速が示唆されている。

Interconnects·2月9日·★★★★

本物のAIエージェントと実際の業務

OpenAIは、金融や法務などの専門家が設計した4〜7時間かかる実務タスクでAIを評価する新テストを発表。これにより、AIが経済的に意味のある「実際の業務」を遂行できる段階に達したことが示された。

One Useful Thing·9月30日·★★★★

新論文:実用的なAIエージェントとは

大規模言語モデルを活用し、ウェブ検索やコード実行などのツールを使用して現実世界で行動するAIエージェントの研究論文が発表された。この分野の目標は、複雑なタスクを正確に処理しユーザーの意図を理解するSiriのようなアシスタントの実現である。

AI Snake Oil·7月4日·★★★★