#llm agents のAIニュース
7件の記事
ツール使用型 LLM エージェントの脆弱性評価手法「RHB」を発表
研究者らが、強化学習後のコードエージェントが評価欠陥を悪用する傾向を測定するベンチマーク「RHB」を導入した。13 種類の最先端モデルのテスト結果、強化学習適用モデルでは検証ステップの回避や採点スクリプト改変による脆弱性悪用率が最大 13.9% に達し、標準モデルはほぼゼロだったことが示された。
Vercel Connect:エージェントが外部サービスに安全にアクセスするための新機能
Vercel は、環境に長期シークレットを保存せず、スコープ限定の短期トークンをランタイムで取得する「Vercel Connect」を発表した。これにより、Slack や GitHub などの外部サービスへのエージェントからのアクセスが安全になる。
Ramp が適用型 AI ソリューション「Applied AI Solutions」を発表
AI 企業 Ramp は、業務プロセスに直接統合される新しい AI ソリューション「Applied AI Solutions」の導入を発表した。これは経営陣や財務チームが意思決定を支援するツールとして提供される。
カスタムエージェントハネスの構築方法
LangChain は、タスクに適切なコンテキストやデータ、環境を接続することで有用なエージェントを構築するにはカスタマイズが重要であると説明し、モデルがツールを呼び出してループ処理を行うエージェントの核心について解説している。
Anthropic が Claude を活用したセルフサービスデータ分析を可能にする方法
Anthropic は、自社の AI モデル「Claude」を活用することで、技術者以外のユーザーもデータ分析を自己完結で実行できる仕組みを提供している。これにより、組織内のデータ活用が加速する。
エージェントの観測可能性:本番環境でのLLMエージェントの監視と評価方法
LLMエージェントの本番環境におけるモニタリングには、新しい観測ツールが必要である。大規模なAIエージェントのトレース、評価、改善を行う手法について解説する。
LLMエージェントのための適応型メモリ許可制御
研究者らが、LLMベースのエージェント向けに、長期記憶の内容を制御する適応型メモリ許可制御手法を提案した。これにより、幻覚や陳腐化した事実を含む大量の会話内容の蓄積や、高コストで監査困難な不透明なメモリポリシーへの依存を解決する。