#langsmith のAIニュース
14件の記事
Factory が LangSmith を活用してフィードバックループを自動化し、反復速度を 2 倍に向上させた事例
LangChain のブログは、企業 Factory が LangSmith ツールを使用してフィードバックループの自動化を実現し、開発の反復速度を 2 倍に加速させた具体的な事例を紹介している。
LangSmith ベンチマークの共有について
LangChain が開発した LangSmith のベンチマーク結果を公開し、AI アプリケーションの評価基準に関する情報を提供しました。
LangSmith:より良い整理のために再設計された製品ホームページとリソースタグ
LangChain が提供する LangSmith の製品ホームページを再設計し、リソースタグ機能を追加して情報の整理を改善しました。
monday Service と LangSmith を組み合わせた、初日からコードファーストの評価戦略の構築
monday Service は LangSmith と連携し、開発初期段階からコードベースで評価を行う戦略を構築した。これにより、AI アプリケーションの品質保証プロセスが強化された。
AI エージェントに専用コンピューターを提供(7 分読了)
LangSmith は、信頼できないコードの実行リスクに対処するため、ハードウェア仮想化されたマイクロ VM を提供する「サンドボックス」を導入しました。これにより AI エージェントは、生産インフラを損なうことなく動的タスクを実行し、永続状態を管理できます。
AWS上のLangSmithを用いたディープエージェントの評価方法
AWSとパートナーのランチェーンが共同で、非確定的なAIエージェントの動作を検証する手法を公開した。これは本番環境への展開前にエラーを早期に発見し、ワークフロー全体への悪影響を防ぐための評価フレームワークである。
プロダクション環境におけるエージェントの失敗を修正:Interrupt 2026 の振り返り | LangChain ニュースレター
LangChain が、プロダクション環境で発生するエージェントの失敗問題を解決するための取り組みについて、イベント「Interrupt 2026」の内容を踏まえて振り返りを発表した。
LangGraph と LangSmith を活用した Lyft のセルフサービス AI エージェントプラットフォーム構築事例
ライドシェア企業の Lyft が、LangChain の LangGraph と LangSmith を利用し、開発者が独自に AI エージェントを構築・管理できるセルフサービスプラットフォームを構築した手法について紹介している。
Credit GenieがInsights Agentを活用し、AI財務アシスタントを改善した方法
Credit GenieはLangSmithのInsights Agentを活用し、顧客向けAI財務アシスタント「AskGenie」の品質を向上させた。この取り組みにより、アシスタントのパフォーマンスと精度が改善された。
LangSmithとLilacを用いたLLMのファインチューニング
LangSmithとLilacを使用して大規模言語モデルをファインチューニングする方法を紹介する。高品質な学習データの収集、データセットのフィルタリングや強化を行い、より高性能なモデルを迅速にデプロイする手法を解説している。
LangSmithでファインチューニング済みオープンソースモデルをテストする
LangSmithは、ファインチューニングされたオープンソース大規模言語モデルの評価と比較を行うツールです。複数のモデルをテストし、評価プロセスを自動化することで、最もパフォーマンスの高いAIを選択することを支援します。
PollyがLangSmithの全作業環境で一般提供開始
LangSmithは、300ステップのトレースを読み込み、失敗箇所を特定して原因を正確に伝えるAIアシスタント「Polly」を全ユーザー向けに一般提供した。
エージェントフレームワークとエージェントの可観測性について
LLMの性能向上に伴い、エージェントフレームワークの必要性が問われるが、エージェントはモデルを包むシステムとして本質的に重要である。
適切なAI評価ツールの選択
著者は、AI評価においてツール選びに過度に注目するのではなく、プロセス重視であるべきだと指摘。また、ツールの陳腐化が速いため比較は困難とし、自身の経験に基づき推奨ツールを示唆している。