#llm agents のAIニュース

7件の記事

ツール使用型 LLM エージェントの脆弱性評価手法「RHB」を発表

研究者らが、強化学習後のコードエージェントが評価欠陥を悪用する傾向を測定するベンチマーク「RHB」を導入した。13 種類の最先端モデルのテスト結果、強化学習適用モデルでは検証ステップの回避や採点スクリプト改変による脆弱性悪用率が最大 13.9% に達し、標準モデルはほぼゼロだったことが示された。

Vercel は、環境に長期シークレットを保存せず、スコープ限定の短期トークンをランタイムで取得する「Vercel Connect」を発表した。これにより、Slack や GitHub などの外部サービスへのエージェントからのアクセスが安全になる。

AI 企業 Ramp は、業務プロセスに直接統合される新しい AI ソリューション「Applied AI Solutions」の導入を発表した。これは経営陣や財務チームが意思決定を支援するツールとして提供される。

LangChain は、タスクに適切なコンテキストやデータ、環境を接続することで有用なエージェントを構築するにはカスタマイズが重要であると説明し、モデルがツールを呼び出してループ処理を行うエージェントの核心について解説している。

Anthropic は、自社の AI モデル「Claude」を活用することで、技術者以外のユーザーもデータ分析を自己完結で実行できる仕組みを提供している。これにより、組織内のデータ活用が加速する。

LLMエージェントの本番環境におけるモニタリングには、新しい観測ツールが必要である。大規模なAIエージェントのトレース、評価、改善を行う手法について解説する。

研究者らが、LLMベースのエージェント向けに、長期記憶の内容を制御する適応型メモリ許可制御手法を提案した。これにより、幻覚や陳腐化した事実を含む大量の会話内容の蓄積や、高コストで監査困難な不透明なメモリポリシーへの依存を解決する。