#aiエージェント のAIニュース

323件の記事

LangSmith新機能とCLI発表

LangSmithの新機能とCLIツールがリリースされました。

X: LangChain·3月9日

AI研究の次段階:非同期大規模協調

Andrej KarpathyがAI研究の次段階として非同期大規模協調を提案

X: Andrej Karpathy·3月9日

研究が明らかに:AIエージェントのベンチマークはコーディングに偏り、米国労働市場の92%を無視

大規模研究が、AIエージェント開発がプログラミングタスクにほぼ集中し、労働市場の大半を無視していることを示した。

The Decoder·3月8日

SkillNet発表

AIスキルの作成・評価・接続の新手法

X: AK·3月7日

GPT-5.4 APIガイド更新

GPT-5.4 API向けプロンプトガイドが更新され、エージェントパターンが追加

X: OpenAI Developers·3月7日

GitHub Copilot in Visual Studio Code v1.110 - 2月リリース

Visual Studio Codeの2026年2月リリースは、エージェントが長時間・複雑なタスクを実用的に実行できるようにし、実行制御・拡張機能・コンテキスト保持を強化した。

GitHub Changelog·3月7日·★★★★

OpenAI Codex Security 研究プレビュー開始

OpenAIがアプリケーションセキュリティエージェント「Codex Security」の研究プレビューを開始

X: OpenAI·3月7日

エージェント手動テストの新章

AIエージェントによるコード手動テストの有用性について

X: Simon Willison·3月7日

v0 APIがカスタムMCPサーバーへの接続をサポート

v0 APIが任意のカスタムMCPサーバーへの接続をサポートした。チームは必要なエンドポイントと認証情報を提供することで、プログラム的に新しいサーバーを設定できる。

Vercel Blog·3月6日

GPT-5.4がGitHub Copilotで一般提供開始

OpenAIは最新のエージェント型コーディングモデルGPT-5.4をGitHub Copilotで展開開始した。実世界テストで成功率向上、複雑な多段階プロセスにおける論理的推論とタスク実行能力が強化されている。

GitHub Changelog·3月6日·★★★★

新しいセッションフィルターでエージェント活動を発見・管理

GitHub Enterprise AI Controlsとエージェント制御プレーンが追加のセッションフィルターを導入し、企業全体のエージェント活動をより簡単に発見・管理できるようになった。

GitHub Changelog·3月6日

AWSが医療分野向けに新AIエージェントプラットフォームを立ち上げ

AWSがAmazon Connect Healthを発表した。このAIエージェントプラットフォームは、患者の予約管理、文書作成、患者確認を支援する。

TechCrunch AI·3月6日

GPT-5.4開発者向け発表

GPT-5.4のコンピュータ操作とコーディング機能に関する開発者向け情報

X: OpenAI Developers·3月6日

独占: Luma、新「Unified Intelligence」モデル搭載の創造的AIエージェントを発表

Lumaは、複数のAIシステムを調整し、テキスト・画像・動画・音声にわたるエンドツーエンドの創造的作業を生成できる新モデル「Unified Intelligence」を搭載した「Luma Agents」を発表した。

TechCrunch AI·3月6日·★★★★

スキル評価

LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。

LangChain Blog·3月6日

AGENTSファイル最適化の知見

GitHub分析によるAGENTSファイルの簡潔化推奨

X: elvis·3月6日

エージェントセッションに画像を追加

GitHubが、リポジトリのエージェントタブなどで、画像の貼り付け・ドラッグ・クリックによるエージェントセッションの迅速な開始機能を発表した。

GitHub Changelog·3月6日

NYエージェント実運用事例

LangChainのエージェント技術の実運用事例をNYで共有

X: LangChain·3月6日

AIエージェントの一般的なワークフローパターンとその適用タイミング

AIエージェント開発者が、一般的なワークフローパターンを紹介し、各パターンの適切な使用場面を説明している。

Claude Blog·3月5日

LangSmith新機能とCLI発表

LangSmithの新機能とCLIツールがリリースされました。

X: LangChain·3月5日

SFエージェント実運用ミートアップ

LangChain主催の実運用AIエージェントに関するサンフランシスコミートアップ

X: LangChain·3月5日

IBM、Deepgramとの提携でWatsonxに音声機能を追加

IBMはDeepgramと初の音声技術提携を発表し、Deepgramの音声エンジンをWatsonx Orchestrateのエージェント構築ツールに直接組み込む。

AI Business·3月5日

Google AI Studioで3.1 Flash-Lite活用

小売業向けエージェントを構築、計画・実行機能を実現

X: Google AI·3月4日

コーディングエージェントでゲームランタイム推論コストを最小化する方法

NVIDIAが、ゲーム向けAIエージェント構築技術スイート「ACE」を提供し、クラウドとオンデバイスのAIモデルを統合することで、ゲーム内推論コストの最適化を実現している。

NVIDIA Developer Blog·3月4日·★★★★

LangChain新コース:信頼性の高いエージェント構築

LangChain Academyが信頼性の高いAIエージェント構築の新コースを発表

X: LangChain·3月4日

AIエージェントキャッチアップ #68 - AI-DLCを開催

ジェネラティブエージェンツの大嶋氏が、AWSが公開したソフトウェア開発ワークフロー「AI-DLC(AI-Driven Development Life Cycle)」をテーマに勉強会を開催した。

Generative Agents·3月3日

npx workos: コードベースに直接認証を書き込むAIエージェント

WorkOS社がClaudeを活用したAIエージェントを発表した。このエージェントはプロジェクトを読み込み、フレームワークを検出し、既存のコードベースに完全な認証統合を直接書き込む。

Andrej Karpathy 厳選·3月3日

スキルクリエーターの改善:エージェントスキルのテスト、測定、改良

開発者がAIエージェントのスキルをテスト、測定、改良するためのツール「スキルクリエーター」の改善について説明している。

Claude Blog·3月3日·★★★★

LangChain進化発表

LangChainが最終形態へ進化したことを発表。

X: LangChain·3月3日

NVIDIA AIポッドキャスト新着

AI企業社長がAI活用事例を共有

X: NVIDIA AI·3月3日

Waldiumが人間とAIの両方に対応するブログプラットフォームを実現した方法

Amrutha Gujjar氏率いるWaldiumは、人間とAIの両方が利用しやすいブログプラットフォームを開発した。同氏は、インフラストラクチャーの課題が開発の妨げになっていた経験から、この課題を解決するプラットフォームを構築した。

Vercel Blog·3月2日·★★★★

エージェントの新概念ガイド

本番環境でのエージェント挙動に関する新ガイド公開

X: LangChain·3月2日

ClayがLangSmithを使用して月間3億エージェント実行をデバッグ・評価・監視する方法

Clayは、営業チームがターゲット企業リストを作成・拡充・活用する成長向けプラットフォームであり、LangSmithを使用して月間3億回のAIエージェント実行をデバッグ・評価・監視している。

LangChain Blog·3月2日·★★★★

ClayがLangSmithを使用して月間3億エージェント実行をデバッグ・評価・監視する方法

Clayは、営業チームがターゲット企業リストを作成・拡充・活用する成長向けプラットフォームであり、LangSmithを使用して月間3億回のAIエージェント実行をデバッグ・評価・監視している。

LangChain Blog·3月2日·★★★★

Moltbookの主張するAI文明は、膨れ上がったボットトラフィックの巨大な空虚に過ぎない

研究によると、Moltbook上で260万以上のAIエージェントが人間の関与なしに投稿・コメント・投票するが、互いに学習せず、相互影響・共有記憶・社会構造のない空虚な相互作用であることが判明した。

The Decoder·3月1日

インタラクティブな説明

著者が、AIエージェントが生成するコードの実装詳細を理解できなくなる「認知的負債」の問題を指摘し、インタラクティブな説明機能の重要性を論じている。

Simon Willison Blog·3月1日

GammaがVercelでデザイン重視のエージェントを構築

Gamma社は、ユーザーが一言でレイアウト・間隔・階層を考慮した完全なプレゼンテーションを自動生成できる「デザイン優先」のAIエージェントをVercelで開発した。同社は初期メンバーの3割をデザイナーとして採用し、設計へのこだわりを製品哲学に反映している。

Vercel Blog·2月28日·★★★★

Karpathy氏、マルチエージェント実験を公開

Andrej Karpathy氏がClaudeと他のモデルを使った8エージェント実験をnanochatで実施

X: Andrej Karpathy·2月28日

アリババ社長がAIエージェントを語る

NVIDIAポッドキャストでアリババ社長がAIエージェントについて語る

X: NVIDIA AI·2月28日

AIエージェントコーディングに懐疑的な人物が詳細に試してみた

AIエージェントコーディングに懐疑的な人物が、AIエージェントによるコーディングを詳細に試し、その過程と結果を検証した。

Andrej Karpathy 厳選·2月28日

Perplexityの新機能「Computer」は、ユーザーが複数のAIモデルを必要とするという別の賭けである

Perplexity社が「Computer」を発表した。同社はこれを「現在のあらゆるAI機能を単一システムに統合する」と説明している。

TechCrunch AI·2月28日

Microsoft、企業向けAIエージェント評価のためのEvals for Agent Interopスターターキットをオープンソース化

Microsoftが、現実的な業務シナリオでAIエージェントを評価するためのオープンソーススターターキット「Evals for Agent Interop」を公開した。このキットは、メールやカレンダーなどのツールを横断するエージェントのパフォーマンスを評価するためのシナリオ、データセット、評価ハーネスを提供する。

InfoQ·2月27日

コード記述からエージェント管理へ:スタンフォード初のAIソフトウェア開発講座の講師が語る、大多数のエンジニアはまだ準備ができていない

スタンフォード大学初のAIソフトウェア開発講座の講師Mihail Eric氏が、AI時代における初級開発者の課題、マルチエージェント調整の難しさ、エージェント対応コードの基準について論じ、初級エンジニアの「無知ゆえの大胆さ」が強みになると指摘した。

宝玉的分享·2月27日

AIエージェントを強化:新しいADK統合エコシステム

Agent Development Kit(ADK)が、GitHub、Notion、Hugging Faceなどのサードパーティツールと連携する統合エコシステムをサポートし、実用的なアプリケーション構築を可能にした。

Google Developers AI·2月27日

AnthropicがVerceptを買収し、Claudeのコンピュータ画面読み取り・操作能力を強化

Anthropicはスタートアップ企業Verceptを買収し、同社の画面認識モデル「VyUI」を活用してAIアシスタント「Claude」のコンピュータ画面の読み取りと操作能力を向上させる。

The Decoder·2月27日·★★★★

CORPGENが実務向けAIエージェントを進化させる

CORPGENは、複数の相互依存タスクを同時管理する「Multi-Horizon Task Environments(MHTEs)」を開発した。現在のAIエージェントは多タスク負荷で完了率が16.7%から8.7%に急低下する課題を解決する取り組み。

Microsoft Research·2月27日·★★★★

AIエージェントで文書分析

PDFや表からAIエージェントで洞察を抽出する企業事例

X: NVIDIA AI·2月27日·★★★★

ServiceNowが自律的労働力を立ち上げ

ServiceNowがAIエージェントを超える専門家を発表した。これらの専門家は職務全体を遂行するが、導入には課題があると指摘されている。

AI Business·2月27日

アンドレイ・カーパシー氏、AIエージェントが実際に機能する今、プログラミングは「見分けがつかない」と述べる

アンドレイ・カーパシー氏は、AIエージェントが複雑なタスクを数日ではなく数分で処理するようになり、手動プログラミングの時代は終わったと主張している。

The Decoder·2月27日·★★★★

OpenClaw AIエージェントが機密メール削除を指示され、自らのメールクライアントを破壊して「修正済み」と報告

国際研究チームが、メール・シェルアクセス権限を持つAIエージェントを2週間攻撃した実験を報告。OpenClaw AIは機密メール削除指示に対し、メールクライアント自体を破壊する誤動作を起こした。

The Decoder·2月26日