LangChain Blog の最新記事
コミュニティ73件の記事
デルタチャンネル:長期実行型エージェントのランタイム進化について
LangGraph 1.2 に新機能「DeltaChannel」が追加され、各ステップで状態差分のみを保存する仕組みにより、セッションが長くなってもストレージコストが増加しないよう改善された。Deep Agents v0.6 でデフォルト実装される。
異なるモデルと連携するよう深層エージェントを調整
Deep Agents は従来汎用的に設計されていたが、今日から OpenAI や Anthropic など各モデル固有のプロファイルを追加し、プロンプトやツールを最適化することでベンチマークスコアを 10〜20 ポイント向上させた。
エージェントの観測可能性:本番環境でのLLMエージェントの監視と評価方法
LLMエージェントの本番環境におけるモニタリングには、新しい観測ツールが必要である。大規模なAIエージェントのトレース、評価、改善を行う手法について解説する。
本番環境におけるディープエージェントのランタイム基盤
長期動作するエージェントの本番デプロイには専用インフラが必要である。本ガイドは、耐久性のある実行、メモリ管理、人間による監督(HITL)、観測可能性について解説し、「deepagents」がこれらを本番環境に展開する方法を示す。
エージェントビルダーのメモリ構築方法:エージェントへの記憶機能の実装
Agent Builderチームは、エージェントの能力を向上させるためのメモリシステムを開発した。本記事では、その設計動機、技術的実装の詳細、得られた教訓、および今後の展望について解説している。
LangChainガイド:観測可能性を用いたAIエージェントのデバッグと評価方法
LangChainは、観測可能性を活用してAIエージェントを効果的に評価する方法を解説する。トレーシングや推論のデバッグ、パフォーマンス分析を通じて、エージェントの動作を反復改善する手法を示している。
エージェント改善ループはトレースから始まる
トレーシングはエージェントの理解と改善の基盤となる。自動化された評価者、人間のレビュー、オフライン評価、回帰テストを通じてAIデータフライホイールを駆動する方法を示す。
LangChain、Google Cloud Next 2026に出展
LangChainはラスベガスで開催される「Google Cloud Next 2026」に出展し、4月22日から24日にかけてブース#5006でAIエージェントに関するセッションを実施する。
LangSmithでマルチエージェント社会ネットワークをシミュレート:村民との連携
LangSmithを用いて、現実的なマルチエージェントの社会ネットワークシミュレーションを構築する。複雑なプロンプトのデバッグ、並列エージェントの追跡、大規模なユーザー行動の予測が可能になる。
エージェント改善ループにおける人間の判断
記事は、AIエージェントの性能向上にはチームの知識と判断が不可欠だと指摘する。文書化された組織知識だけでなく、従業員に内在する暗黙知を活用することが、優れた組織の成功要因であることを示唆している。
Interrupt 2026のプレビュー:エンタープライズ規模のエージェント
Interrupt 2026は5月13-14日、サンフランシスコで開催される。ラインアップ、フォーマット、規模が大幅に向上し、エンタープライズ規模でのエージェント技術の進化を示唆している。
Deep Agents Deploy:Claude Managed Agentsに代わるオープンな代替案
DeepAgentsは、モデル非依存でオープンソースのエージェントハネスを本番環境向けに迅速にデプロイする新ベータ版サービスを開始した。
バックグラウンドでのサブエージェントの実行
Deep Agentsは、同期サブエージェントがスーパーバイザーをブロックする問題を解決し、非同期サブエージェントをサポート。これにより、バックグラウンドタスクをリアルタイムで起動・制御・中止可能になった。
LangSmithにおける再利用可能な評価器とテンプレート
LangSmithは、30以上の評価テンプレートと中央ハブを追加し、プロジェクト間で評価器を再利用可能にした。これにより、ユーザーは毎回ゼロから作成することなく、より高品質な評価を迅速に構築・適用できる。
Better Harness:評価を用いたハルクライミングによる最適化レシピ
本研究は、評価(evals)を学習信号として用い、エージェントのハルクライミングにより「Better Harness」を反復的に構築・改善するシステムを紹介する。この手法は、エージェントの過学習を防ぎ、一般化能力を高める設計決定を含む。
Credit GenieがInsights Agentを活用し、AI財務アシスタントを改善した方法
Credit GenieはLangSmithのInsights Agentを活用し、顧客向けAI財務アシスタント「AskGenie」の品質を向上させた。この取り組みにより、アシスタントのパフォーマンスと精度が改善された。
あなたのハネス、あなたのメモリ
エージェント構築の主流であるAgent harnessは、メモリと密接に関連する。クローズドなハネスを使用すると、サードパーティにメモリの制御を委ねることになり、強力なロックインを生む。そのため、ユーザーが自身のメモリを所有できるよう、ハネスとメモリはオープンであるべきだと主張する。
LangSmithとLilacを用いたLLMのファインチューニング
LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。
LangSmithでファインチューニング済みオープンソースモデルをテストする
LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。
プロンプトの風景
LangChain Hubは、大規模言語モデル(LLM)の推論、RAG、SQL、コード生成などの分野におけるプロンプトエンジニアリング手法を提供し、ユーザーがプロンプトの閲覧と管理を可能にする。
アジェンティック・エンジニアリング:AIエージェントの群れがソフトウェアエンジニアリングを再定義する方法
LangGraphに基づくマルチエージェントシステムは、実際のエンジニアリングチームを模倣し、デバッグ時間を93%削減し、クロスチームの納期を圧縮する。
ドキュメントの自己テストをどのように実装したか
著者は、更新されにくいコードサンプルの問題に対処するため、Deep Agents CLIを用いてインラインコードをテスト可能でCI対応の例へ自動移行する手法を開発した。
あなたのハーネス、あなたの記憶
AIエージェントのハーネスはエージェント構築の主流となり、エージェントの記憶と密接に関連している。クローズドなハーネスを使用すると、エージェントの記憶制御を第三者に委ねることになる。記憶は優れたエージェント体験の構築に極めて重要である。
Interrupt 2026を予告:エンタープライズ規模でのエージェント
LangSmithチームが、昨年のInterruptカンファレンスでCiscoやUberなどの企業がエージェントの本番導入の実態を共有し、LangSmith Deploymentの提供や新たな監視ツールの展開を行ったことを報告している。
Deep Agents Deploy:Claude Managed Agentsに対するオープンな代替手段
Deep Agentsは、モデルに依存しないオープンソースのエージェントハーネス「Deep Agents deploy」をベータ版としてリリースした。同社は、本ツールが本番環境で使用可能な最も迅速な方法だと述べている。
エージェント改善ループにおける人間の判断
LangChainのRahul Verma氏が、AIエージェントの効果的な運用には、組織の暗黙知を含む人間の判断を継続的に組み込む改善ループが重要だと論じている。
Better Harness: 評価を用いたハーネス山登り法のレシピ
LangChainのVivek Trivedy氏が、評価を学習信号として活用し、過学習ではなく汎化を促す設計で、より優れたエージェントを構築するためのシステム「Better-Harness」を紹介している。
Deep Agents v0.5のリリース
Deep Agentsチームは、非同期サブエージェントやマルチモーダルファイルシステム対応などを搭載した「deepagents」と「deepagentsjs」の新版を公開した。これにより、メインエージェントがブロックされずにバックグラウンドで遠隔エージェントに作業を委譲できるようになった。
Arcade.devツールがLangSmith Fleetに統合
LangSmith FleetはArcade.devと提携し、7,500以上のエージェント最適化ツールを単一の安全なゲートウェイを通じて提供する。
AIエージェントの継続的学習
LangChain社が、AIエージェントの継続的学習はモデル層だけでなく、ハーネス層とコンテキスト層の3層で行われると指摘し、時間とともに進化するシステム構築の考え方を変えると述べた。
本番環境でエージェントが自己修復する仕組み
LangChainのソフトウェアエンジニアVishnu Suresh氏が、GTMエージェント向けに自己修復デプロイパイプラインを構築した。デプロイ後に回帰を検出し、変更の原因を特定し、修正PRを自動的に作成する。
オープンモデルが閾値を超えた
LangChain社が評価したところ、GLM-5やMiniMax M2.7などのオープンウェイト大規模言語モデルは、ファイル操作やツール使用などのコアエージェントタスクにおいて、従来のクローズドモデルと同等の性能を、低コスト・低遅延で達成している。
2026年3月:LangChainニュースレター
LangChainが、NVIDIAとの新統合、Interrupt 2026のチケット販売、LangSmith Fleet(旧Agent Builder)の発表を実施。また、LangSmithでAIアシスタントPollyの一般提供を開始した。
LangChainとMongoDBのパートナーシップ発表:信頼できるデータベース上で動作するAIエージェントスタック
LangChain社はMongoDB社と提携し、検索・永続メモリ・運用データアクセス・可観測性・信頼性のあるデプロイメントを単一のオープンプラットフォームに統合したAIエージェントスタックを構築した。これにより開発チームはデータ層を再構築せずにプロトタイプから本番環境へ移行できる。
エージェント評価準備チェックリスト
LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。
ケンショがLangGraphで信頼できる金融データ検索を解決するマルチエージェントフレームワークを構築した方法
ケンショのエンジニアチームが、S&Pグローバルの膨大なデータ資産から効率的に検索するため、LangGraphを使用したマルチエージェントフレームワークを開発した。このフレームワークは、AIが業界を変革する中で、信頼できるデータに基づいた出力を保証することを目的としている。
Deep Agentsの評価手法の構築方法
LangChain社が、Deep Agentsの評価指標を構築する方法を説明している。同社は、エージェントの行動を直接測定する評価データの収集、指標作成、対象を絞った実験を通じて、エージェントの精度と信頼性を向上させている。
ミドルウェアでエージェントハーネスをカスタマイズする方法
LangChain社は、エージェントハーネスをカスタマイズ可能にする「Agent Middleware」を発表した。このミドルウェアは、LLMを環境に接続する基盤の上に構築でき、ユースケースに応じたカスタマイズを可能にする。
LangSmith Fleetにおけるスキル機能
LangSmithはFleetで共有可能なスキル機能を追加し、チーム全体のエージェントに専門タスクの知識を装備できるようにした。プロンプトや手動で作成し、ワークスペースで自動同期される。
ModaがDeep Agentsで本番環境対応のAIデザインエージェントを構築する方法
Modaは、デザイン経験のないマーケターや経営者向けに、プレゼン資料やSNS投稿を生成するAIデザインプラットフォームを提供している。同社は編集可能な2Dベクターキャンバス上で直接デザインを構築・反復するAIサイドバーを搭載している。
Google Cloud Next 2026でLangChainに参加しよう
LangChainが、2026年4月22日から24日にラスベガスで開催されるGoogle Cloud Next 2026に出展し、ブースでエンジニアリングチームがデモを実施し技術的な会話を提供する予定である。
2種類のエージェント認証方式
LangSmith Fleetが2種類のエージェント認証方式を導入した。エージェントがSlackツールを呼び出す際の認証方法を明確化し、エージェントの権限管理を改善する。
LangSmith Fleetの紹介
LangSmithがAgent BuilderをFleetに改名し、チームがエージェントを構築・管理・共有できる一元化プラットフォームを提供。新しい認証・権限モデルも導入。
PollyがLangSmithの全作業環境で一般提供開始
LangSmithは、300ステップのトレースを読み込み、失敗箇所を特定して原因を正確に伝えるAIアシスタント「Polly」を全ユーザー向けに一般提供した。
LangSmithサンドボックスの紹介:エージェント向けの安全なコード実行環境
LangSmithがプライベートプレビューでサンドボックスを発表した。これは、信頼できないコードを安全かつスケーラブルに実行するための隔離環境を提供し、エージェントがデータ分析やAPI呼び出しを安全に行えるようにする。
Open SWE:社内コーディングエージェントのためのオープンソースフレームワーク
LangChain社が、StripeやRampなど複数企業が独自開発した社内コーディングエージェントを統合するオープンソースフレームワーク「Open SWE」を発表した。既存のSlackやGitHubなどのワークフローに統合可能な設計となっている。
LangChain、NVIDIAと連携したエンタープライズ向けエージェントAIプラットフォームを発表
LangChainがNVIDIAと包括的に連携し、企業が本番レベルのAIエージェントを大規模に構築・展開・監視できるエンタープライズ向けプラットフォームを提供する。
deploy cliの紹介
LangChain社がlanggraph-cliパッケージにdeploy cliを導入し、コマンドラインから直接エージェントをデプロイ・管理できるようにした。最初のコマンド「langgraph deploy」は、エージェントをLangSmith Deploymentにワンステップでデプロイし、GitHub ActionsなどのCI/CDワークフローへの統合を容易にする。
自律的コンテキスト圧縮
LangChain社がDeep Agents SDKとCLIに、モデルが適切なタイミングで自身のコンテキストウィンドウを圧縮できるツールを追加した。
エージェントハーネスの解剖学
LangChainのVivek Trivedy氏が、エージェントを「モデル+ハーネス」と定義し、ハーネスがAIモデルの知能を実用的な作業エンジンに変換するシステム構築手法であると説明している。