LangChain Labs の紹介
LangChain は継続的学習(Continual Learning)に焦点を当てた新研究機関「LangChain Labs」を立ち上げ、エージェントの自己改善と効率化に向けた実用的な研究開発を開始した。
キーポイント
継続的学習への注力
エージェントの実行データから有用なシグナルを抽出・変換し、モデルやハネスの最適化にフィードバックする継続的学習の研究を開始した。
LangSmith との連携強化
既存の LangSmith が提供するトレーシング機能を基盤とし、データ収集から改善までのサイクルを加速させることで先行性を確保する。
主要パートナーとの共同研究
Harvey, Nvidia, Prime Intellect などの業界大手と提携し、法務や複雑なタスクにおける効率的で自己改善型エージェントの実現を目指す。
影響分析・編集コメントを表示
影響分析
この発表は、単なるツール提供から「データ駆動型の自己改善サイクル」を構築する研究機関へと LangChain の役割を進化させる重要な転換点です。特に、大規模なエージェント実行データをどう活用するかという業界共通の課題に対し、LangSmith を介した具体的な解決策を示すことで、実務レベルでのエージェント開発効率を劇的に向上させる可能性があります。
編集コメント
LangChain が単なるライブラリ提供から、データ駆動型エージェントの生態系を構築する研究パートナーへと進化していることが伺えます。特に LangSmith との連携による「実行データ→学習→改善」のループ確立は、実務における AI エージェントの成熟度を高める鍵となるでしょう。
本日、LangChain Labs を立ち上げます。これは継続的学習に焦点を当てた新しい応用研究の取り組みです。私たちの目標は、すべてのエージェントのためのオープンで応用的な研究を推進することです。この技術がより広いエージェント構築コミュニティにとって有用となるよう、業界全体のパートナーと協力して取り組んでいます。
あらゆるエージェントの実行には有用なシグナルが含まれています。解決すべきオープンな課題は、そのシグナルをどのように捕捉し、利用可能なデータに変換し、さらにその改善点を適用するかという点です。
データの捕捉、変換、保存こそが、LangSmith が構築された目的であり、これが私どもとお客様に継続的学習の解明において先行するスタートを提供すると確信しています。
これらの変更は、エージェントハネスの最適化や異なるモデルの選択、モデルのファインチューニングなど、エージェントスタックの異なるレイヤーで適用できます。
この取り組みは、Harvey、Nvidia、Prime Intellect、Fireworks、Baseten といった数社の初期研究パートナーと共に開始します。
***効率的で自己改善型のエージェントに関する応用研究を推進し、最も複雑な法的業務に役立てるため、LangChain Labs チームと協力できることを嬉しく思います。
*— Niko Grupen, Applied Research Head, Harvey
私たちが取り組む初期の研究方向は以下の通りです:
大規模なエージェントデータからの情報抽出によるエージェントの改善:** エージェントは急速にソフトウェアシステムに統合されつつあります。まもなく、エージェントが数ヶ月で生成するデータ量は、人類がこれまでに集計して生み出した総量を超えます。評価や環境生成、ハッチングエンジニアリング、ポストトレーニングのために、そのデータから有用なシグナルを抽出することは依然として困難な課題です。トレースはそうしたデータの源泉であり、すべてのチームがトレースを活用してより優れたエージェントを構築できるよう支援したいと考えています。
パレートフロンティアにおける効率的なエージェント: エージェントは、コスト、レイテンシ、タスクパフォーマンスに関する組織上の制約の下で動作します。世界で最も重要なタスクの多くにおいて、自己改善を実現するモデルハッチング、モデル、フィードバックループの最適な組み合わせはまだ見つかっていません。
評価およびシミュレーション環境の体系的構築: エージェントを適切に評価するためには、本番環境での使用状況を反映した環境でエンドツーエンド方式で実行する必要があります。これらの環境は作成が難しく、時間がかかる場合があります。私たちは、評価、シミュレーション、強化学習のための環境を作成・実行しやすくするための方法を研究しています。
プロンプト最適化: プロンプトはモデルファミリーごとに固有のものであり、あるモデルファミリーから次のモデルファミリーへ移行する際、煩わしく時間がかかることがあります。
私たちは、チームがタスクに最適なモデルを容易に選択できるマルチモデルの未来を信じています。モデル間でのプロンプト最適化は、これらの移行をより容易にし、必要な手動調整の量を減らすのに役立ちます。
パートナーとの初期の取り組みには、異なる垂直ドメイン(法務サービスなど)間でエージェントがどのように一般化するかの測定が含まれます。また、Nemotron などのオープンモデルを活用したエンジニアリングとファインチューニングにより、コスト効率の高いサブエージェントを構築し、チームがトレースデータを利用可能なデータに変換してエージェントを改善できる評価環境やテスト環境を整備しています。
私たちのオープンソースエコシステムは、ビルダー同士が互いに学び合うための核心的な要素であり続けており、LangChain Labs もこのパターンを引き継いでいくことを望んでいます。私たちは、より広範なエージェント構築コミュニティに役立つ研究、評価、およびオープンソースの統合を継続して公開していきます。
私たちは、エージェントがどのように学習し、適応し、改善するかを探求したいチームとパートナーシップを結ぶことを望んでいます。私たちの目標は、次世代の自己改善型エージェントを支えるより開放的な研究を推進することです。
私たちが学んだことについて共有し、コミュニティと共にこの取り組みを継続して構築していくことに興奮しています。
原文を表示
Today we’re launching LangChain Labs, a new applied research effort focused on continual learning. Our goal is to advance open, applied research for every agent. We’re working with partners across industries to make sure this technology is useful for the broader agent-building community.
Every agent run contains useful signal. The open problem is how to capture that signal, transform it into usable data, and then applying those improvements.
This capturing, transforming, and storing of data is exactly what LangSmith was built for, which we believes providers us and our customers a head start in figuring out continual learning.
These changes can be applied at different layers of the Agent stack such as the optimizing the agent harness, choosing different models, or fine-tuning models.
We’re starting this work with a few early research partners including Harvey, Nvidia, Prime Intellect, Fireworks, and Baseten.
We’re excited to work with the LangChain Labs team to push applied research on efficient, self-improving agents for the most complex legal work. — Niko Grupen, Head of Applied Research, Harvey
The early research directions we’re tackling are:
Improving Agents by Mining Information from Large-Scale Agent Data: Agents are being integrated into software systems at a rapid rate. Very soon agents will produce more data in months than humans have ever produced in aggregate. Extracting useful signals from that data for eval/environment generation, harness engineering, and post-training is still a difficult problem. Traces are the source of that data and we want to help every team use traces to build better agents.
Efficient Agents at the Pareto Frontier: Agents operate under real organizational constraints around cost, latency, and task performance. For many of the world’s most important tasks, we’re yet to discover the most efficient combination of models harnesses, models, and feedback loops that allow agents to self-improve.
Systematic building of evaluation and simulation environments: To properly evaluate agents, you often need to run them in an end-to-end manner in an environment representative of how they will be used in production. These environments can be difficult and time consuming to create. We’re researching ways to make it easier to create and run environments for evaluation, simulation, and reinforcement learning.
Prompt Optimization: Prompts are specific to model families, and it can be annoying and time consuming to migrate from one model family to the next.
We believe in a multi-model future where teams can choose the right model for the task easily. Prompt optimization across models can help make those migrations easier and reduce the amount of manual tuning required.
Some early work with our partners includes measuring how agents generalize between different vertical domains (like legal services); harness engineering & fine-tuning open models like Nemotron as cost-efficient subagents; and building evals/environments so teams can turn their trace data into usable data to improve agents.
Our open-source ecosystem has always been a core part of how builders learn from each other, and we want LangChain Labs to continue that pattern. We’ll continue publishing research, evals, and open-source integrations that help the broader agent-building community.
We want to partner with teams looking to explore how agents learn, adapt, and improve. Our goal is to advance more open research powering the next generation of self-improving agents.
We’re excited to share what we learn and keep building this with the community.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み