#llm ops のAIニュース

5件の記事

Harbor と LangChain の統合：エージェント評価のための統一スタック

LangChain が、エージェントの評価を一元化するための新しいプラットフォーム「Harbor」との連携を発表し、開発者がエージェントのパフォーマンスを効率的に検証できる環境を提供する。

LangChain Blog·7月1日

エージェントスタックの紹介

Vercel は、サポート対応からコード作成まであらゆる作業を担うエージェントが動作するために必要な、モデル間のルーティング、多段階ワークフローの実行、および外部システムとの接続という 3 つのコア機能について解説した。

Vercel Blog·6月17日·★★★★

Strands Evals を用いた AI エージェントの失敗検出と根本原因分析

AWS は、生産環境で動作する AI エージェントが失敗した際の理由特定を自動化し、手動診断によるボトルネックを解消する「Strands Evals」の評価手法を発表しました。

AWS Machine Learning Blog·6月16日·★★★★

monday Service + LangSmith: 初日からコードファーストの評価戦略を構築

monday Serviceが、顧客対応サービスエージェント向けに評価主導の開発フレームワークを構築した方法を紹介。

LangChain Blog·2月18日·★★★★

AIエージェントキャッチアップ #56 - LangWatchを開催

ジェネラティブエージェンツが、プロンプト最適化機能を持つLLM Opsプラットフォーム「LangWatch」をテーマにした勉強会を開催した。

Generative Agents·11月11日