#llm ops のAIニュース
5件の記事
Harbor と LangChain の統合:エージェント評価のための統一スタック
LangChain が、エージェントの評価を一元化するための新しいプラットフォーム「Harbor」との連携を発表し、開発者がエージェントのパフォーマンスを効率的に検証できる環境を提供する。
LangChain Blog·7月1日
エージェントスタックの紹介
Vercel は、サポート対応からコード作成まであらゆる作業を担うエージェントが動作するために必要な、モデル間のルーティング、多段階ワークフローの実行、および外部システムとの接続という 3 つのコア機能について解説した。
Vercel Blog·6月17日·★★★★
Strands Evals を用いた AI エージェントの失敗検出と根本原因分析
AWS は、生産環境で動作する AI エージェントが失敗した際の理由特定を自動化し、手動診断によるボトルネックを解消する「Strands Evals」の評価手法を発表しました。
AWS Machine Learning Blog·6月16日·★★★★
monday Service + LangSmith: 初日からコードファーストの評価戦略を構築
monday Serviceが、顧客対応サービスエージェント向けに評価主導の開発フレームワークを構築した方法を紹介。
LangChain Blog·2月18日·★★★★
AIエージェントキャッチアップ #56 - LangWatchを開催
ジェネラティブエージェンツが、プロンプト最適化機能を持つLLM Opsプラットフォーム「LangWatch」をテーマにした勉強会を開催した。
Generative Agents·11月11日