#langsmith のAIニュース

14件の記事

Factory が LangSmith を活用してフィードバックループを自動化し、反復速度を 2 倍に向上させた事例

LangChain のブログは、企業 Factory が LangSmith ツールを使用してフィードバックループの自動化を実現し、開発の反復速度を 2 倍に加速させた具体的な事例を紹介している。

LangChain が開発した LangSmith のベンチマーク結果を公開し、AI アプリケーションの評価基準に関する情報を提供しました。

LangChain が提供する LangSmith の製品ホームページを再設計し、リソースタグ機能を追加して情報の整理を改善しました。

monday Service は LangSmith と連携し、開発初期段階からコードベースで評価を行う戦略を構築した。これにより、AI アプリケーションの品質保証プロセスが強化された。

LangSmith は、信頼できないコードの実行リスクに対処するため、ハードウェア仮想化されたマイクロ VM を提供する「サンドボックス」を導入しました。これにより AI エージェントは、生産インフラを損なうことなく動的タスクを実行し、永続状態を管理できます。

AWSとパートナーのランチェーンが共同で、非確定的なAIエージェントの動作を検証する手法を公開した。これは本番環境への展開前にエラーを早期に発見し、ワークフロー全体への悪影響を防ぐための評価フレームワークである。

LangChain が、プロダクション環境で発生するエージェントの失敗問題を解決するための取り組みについて、イベント「Interrupt 2026」の内容を踏まえて振り返りを発表した。

ライドシェア企業の Lyft が、LangChain の LangGraph と LangSmith を利用し、開発者が独自に AI エージェントを構築・管理できるセルフサービスプラットフォームを構築した手法について紹介している。

Credit GenieはLangSmithのInsights Agentを活用し、顧客向けAI財務アシスタント「AskGenie」の品質を向上させた。この取り組みにより、アシスタントのパフォーマンスと精度が改善された。

LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。

LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。

LangSmithは、300ステップのトレースを読み込み、失敗箇所を特定して原因を正確に伝えるAIアシスタント「Polly」を全ユーザー向けに一般提供した。

LLMの性能向上に伴い、エージェントフレームワークの必要性が問われるが、エージェントはモデルを包むシステムとして本質的に重要である。

著者は、AI評価においてツール選びに過度に注目するのではなく、プロセス重視であるべきだと指摘。また、ツールの陳腐化が速いため比較は困難とし、自身の経験に基づき推奨ツールを示唆している。