#langchain のAIニュース
78件の記事
トークンストリームからエージェントストリームへ
LangChain と LangGraph が、Deep Agents の最新ストリーミング機能を活用し、型安全なイベントやマルチモーダル出力を実現するプロダクション対応のエージェントアプリケーション構築を可能にした。
Auth Proxy が LangSmith エージェントサンドボックスをどのように保護するか
LangChain は、認証プロキシにより LangSmith のエージェント実行環境から機密情報を排除し、外部への通信を制限することでセキュリティリスクを軽減する仕組みを発表した。
今日は何も大きな出来事はありませんでした
Smol AI News は、5 月 16 日から 18 日にかけての期間に、主要なニュースや技術進展がない静かな日であったと報告しています。
本日は特に目立った出来事なし
AIニュース配信元「AINews」は、2026年5月12日から13日にかけての期間に、主要なSNSや掲示板で注目すべき技術進展や業界動向が確認されなかったと報告した。
本日は特に目立った出来事なし
AIニュースの週報(2026年5月1日〜4日)において、12件のサブレッドや544件のツイートを調査したが、特筆すべき技術進展や業界動向は確認されなかった。
異なるモデルと連携するよう深層エージェントを調整
Deep Agents は従来汎用的に設計されていたが、今日から OpenAI や Anthropic など各モデル固有のプロファイルを追加し、プロンプトやツールを最適化することでベンチマークスコアを 10〜20 ポイント向上させた。
エージェントの観測可能性:本番環境でのLLMエージェントの監視と評価方法
LLMエージェントの本番環境におけるモニタリングには、新しい観測ツールが必要である。大規模なAIエージェントのトレース、評価、改善を行う手法について解説する。
本番環境におけるディープエージェントのランタイム基盤
長期動作するエージェントの本番デプロイには専用インフラが必要である。本ガイドは、耐久性のある実行、メモリ管理、人間による監督(HITL)、観測可能性について解説し、「deepagents」がこれらを本番環境に展開する方法を示す。
エージェントビルダーのメモリ構築方法:エージェントへの記憶機能の実装
Agent Builderチームは、エージェントの能力を向上させるためのメモリシステムを開発した。本記事では、その設計動機、技術的実装の詳細、得られた教訓、および今後の展望について解説している。
LangChainガイド:観測可能性を用いたAIエージェントのデバッグと評価方法
LangChainは、観測可能性を活用してAIエージェントを効果的に評価する方法を解説する。トレーシングや推論のデバッグ、パフォーマンス分析を通じて、エージェントの動作を反復改善する手法を示している。
エージェント改善ループはトレースから始まる
トレーシングはエージェントの理解と改善の基盤となる。自動化された評価者、人間のレビュー、オフライン評価、回帰テストを通じてAIデータフライホイールを駆動する方法を示す。
LangChain、Google Cloud Next 2026に出展
LangChainはラスベガスで開催される「Google Cloud Next 2026」に出展し、4月22日から24日にかけてブース#5006でAIエージェントに関するセッションを実施する。
LangSmithでマルチエージェント社会ネットワークをシミュレート:村民との連携
LangSmithを用いて、現実的なマルチエージェントの社会ネットワークシミュレーションを構築する。複雑なプロンプトのデバッグ、並列エージェントの追跡、大規模なユーザー行動の予測が可能になる。
エージェント改善ループにおける人間の判断
記事は、AIエージェントの性能向上にはチームの知識と判断が不可欠だと指摘する。文書化された組織知識だけでなく、従業員に内在する暗黙知を活用することが、優れた組織の成功要因であることを示唆している。
Interrupt 2026のプレビュー:エンタープライズ規模のエージェント
Interrupt 2026は5月13-14日、サンフランシスコで開催される。ラインアップ、フォーマット、規模が大幅に向上し、エンタープライズ規模でのエージェント技術の進化を示唆している。
Deep Agents Deploy:Claude Managed Agentsに代わるオープンな代替案
DeepAgentsは、モデル非依存でオープンソースのエージェントハネスを本番環境向けに迅速にデプロイする新ベータ版サービスを開始した。
バックグラウンドでのサブエージェントの実行
Deep Agentsは、同期サブエージェントがスーパーバイザーをブロックする問題を解決し、非同期サブエージェントをサポート。これにより、バックグラウンドタスクをリアルタイムで起動・制御・中止可能になった。
LangSmithにおける再利用可能な評価器とテンプレート
LangSmithは、30以上の評価テンプレートと中央ハブを追加し、プロジェクト間で評価器を再利用可能にした。これにより、ユーザーは毎回ゼロから作成することなく、より高品質な評価を迅速に構築・適用できる。
Better Harness:評価を用いたハルクライミングによる最適化レシピ
本研究は、評価(evals)を学習信号として用い、エージェントのハルクライミングにより「Better Harness」を反復的に構築・改善するシステムを紹介する。この手法は、エージェントの過学習を防ぎ、一般化能力を高める設計決定を含む。
あなたのハネス、あなたのメモリ
エージェント構築の主流であるAgent harnessは、メモリと密接に関連する。クローズドなハネスを使用すると、サードパーティにメモリの制御を委ねることになり、強力なロックインを生む。そのため、ユーザーが自身のメモリを所有できるよう、ハネスとメモリはオープンであるべきだと主張する。
LangSmithとLilacを用いたLLMのファインチューニング
LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。
LangSmithでファインチューニング済みオープンソースモデルをテストする
LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。
プロンプトの風景
LangChain Hubは、大規模言語モデル(LLM)の推論、RAG、SQL、コード生成などの分野におけるプロンプトエンジニアリング手法を提供し、ユーザーがプロンプトの閲覧と管理を可能にする。
アジェンティック・エンジニアリング:AIエージェントの群れがソフトウェアエンジニアリングを再定義する方法
LangGraphに基づくマルチエージェントシステムは、実際のエンジニアリングチームを模倣し、デバッグ時間を93%削減し、クロスチームの納期を圧縮する。
ドキュメントの自己テストをどのように実装したか
著者は、更新されにくいコードサンプルの問題に対処するため、Deep Agents CLIを用いてインラインコードをテスト可能でCI対応の例へ自動移行する手法を開発した。
本日は特に目立った出来事なし
2026年4月9日から10日にかけてのAIニュースを、12のサブレッドと544件のツイッター投稿から収集した結果、特筆すべき大きな出来事は確認されなかった。
エージェント改善ループにおける人間の判断
LangChainのRahul Verma氏が、AIエージェントの効果的な運用には、組織の暗黙知を含む人間の判断を継続的に組み込む改善ループが重要だと論じている。
今日の動向:AnthropicのMythos、OpenAIの制限付きサイバーモデル、LangChainのDeep Agents、およびサンドボックス基盤の拡大
AnthropicとOpenAIの新モデル議論、LangChainが公開したエージェントアーキテクチャ、そして強化学習用サンドボックスのインフラ整備状況について報じています。
Better Harness: 評価を用いたハーネス山登り法のレシピ
LangChainのVivek Trivedy氏が、評価を学習信号として活用し、過学習ではなく汎化を促す設計で、より優れたエージェントを構築するためのシステム「Better-Harness」を紹介している。
Deep Agents v0.5のリリース
Deep Agentsチームは、非同期サブエージェントやマルチモーダルファイルシステム対応などを搭載した「deepagents」と「deepagentsjs」の新版を公開した。これにより、メインエージェントがブロックされずにバックグラウンドで遠隔エージェントに作業を委譲できるようになった。
Arcade.devツールがLangSmith Fleetに統合
LangSmith FleetはArcade.devと提携し、7,500以上のエージェント最適化ツールを単一の安全なゲートウェイを通じて提供する。
本番環境でエージェントが自己修復する仕組み
LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。
オープンモデルが閾値を超えた
LangChain社が評価したところ、GLM-5やMiniMax M2.7などのオープンウェイト大規模言語モデルは、ファイル操作やツール使用などのコアエージェントタスクにおいて、従来のクローズドモデルと同等の性能を、低コスト・低遅延で達成している。
Helidon 4.4.0がOpenJDKリリースサイクルへの準拠とJava Verified Portfolioによるサポートを導入
Oracleがマイクロサービスフレームワーク「Helidon」のバージョン4.4.0をリリースした。新バージョンはOpenJDKのリリースサイクルに準拠し、Java Verified Portfolioによるサポート、新たなコア機能、LangChain4j向けのエージェントAIサポートを特徴とする。
2026年3月:LangChainニュースレター
LangChainが、NVIDIAとの新統合、Interrupt 2026のチケット販売、LangSmith Fleet(旧Agent Builder)の発表を実施。また、LangSmithでAIアシスタントPollyの一般提供を開始した。
LangChainとMongoDBのパートナーシップ発表:信頼できるデータベース上で動作するAIエージェントスタック
LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。
エージェント評価準備チェックリスト
LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。
Deep Agentsの評価手法の構築方法
LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。
ミドルウェアでエージェントハーネスをカスタマイズする方法
LangChain社は、エージェントハーネスをカスタマイズ可能にする「Agent Middleware」を発表した。このミドルウェアは、LLMを環境に接続する基盤の上に構築でき、ユースケースに応じたカスタマイズを可能にする。
LangSmith Fleetにおけるスキル機能
LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。
Google Cloud Next 2026でLangChainに参加しよう
LangChainが、2026年4月22日から24日にラスベガスで開催されるGoogle Cloud Next 2026に出展し、ブースでエンジニアリングチームがデモを実施し技術的な会話を提供する予定である。
2種類のエージェント認証方式
LangSmith Fleetが2種類のエージェント認証方式を導入した。エージェントがSlackツールを呼び出す際の認証方法を明確化し、エージェントの権限管理を改善する。
NVIDIA AI-QとLangChainによるエンタープライズ検索向けディープエージェントの構築方法
NVIDIAがLangChainと連携し、企業向けAIエージェント「AI-Q」を開発。データの断片化や文脈不足を解決するエンタープライズ検索ソリューションを提供する。
PollyがLangSmithの全作業環境で一般提供開始
LangSmithは、300ステップのトレースを読み込み、失敗箇所を特定して原因を正確に伝えるAIアシスタント「Polly」を全ユーザー向けに一般提供した。
LangSmithサンドボックスの紹介:エージェント向けの安全なコード実行環境
LangSmithがプライベートプレビューでサンドボックスを発表した。これは、信頼できないコードを安全かつスケーラブルに実行するための隔離環境を提供し、エージェントがデータ分析やAPI呼び出しを安全に行えるようにする。
LangChain、NVIDIAと連携したエンタープライズ向けエージェントAIプラットフォームを発表
LangChainがNVIDIAと包括的に連携し、企業が本番レベルのAIエージェントを大規模に構築・展開・監視できるエンタープライズ向けプラットフォームを提供する。
deploy cliの紹介
LangChain社がlanggraph-cliパッケージにdeploy cliを導入し、コマンドラインから直接エージェントをデプロイ・管理できるようにした。最初のコマンド「langgraph deploy」は、エージェントをLangSmith Deploymentにワンステップでデプロイし、GitHub ActionsなどのCI/CDワークフローへの統合を容易にする。
自律的コンテキスト圧縮
LangChain社がDeep Agents SDKとCLIに、モデルが適切なタイミングで自身のコンテキストウィンドウを圧縮できるツールを追加した。
エージェントハーネスの解剖学
LangChainのVivek Trivedy氏が、エージェントを「モデル+ハーネス」と定義し、ハーネスがAIモデルの知能を実用的な作業エンジンに変換するシステム構築手法であると説明している。
スキル評価
LangChain社が、CodexやClaude Codeなどのコーディングエージェント向けに、LangChain/LangSmithエコシステムで動作するスキルを構築している。スキル構築の重要な部分は、実際に機能することを確認する評価プロセスである。