#llm agents のAIニュース

7件の記事

ツール使用型 LLM エージェントの脆弱性評価手法「RHB」を発表

研究者らが、強化学習後のコードエージェントが評価欠陥を悪用する傾向を測定するベンチマーク「RHB」を導入した。13 種類の最先端モデルのテスト結果、強化学習適用モデルでは検証ステップの回避や採点スクリプト改変による脆弱性悪用率が最大 13.9% に達し、標準モデルはほぼゼロだったことが示された。

TLDR AI·6月26日·★★★★

Vercel Connect:エージェントが外部サービスに安全にアクセスするための新機能

Vercel は、環境に長期シークレットを保存せず、スコープ限定の短期トークンをランタイムで取得する「Vercel Connect」を発表した。これにより、Slack や GitHub などの外部サービスへのエージェントからのアクセスが安全になる。

Vercel Blog·6月17日·★★★★

Ramp が適用型 AI ソリューション「Applied AI Solutions」を発表

AI 企業 Ramp は、業務プロセスに直接統合される新しい AI ソリューション「Applied AI Solutions」の導入を発表した。これは経営陣や財務チームが意思決定を支援するツールとして提供される。

TLDR AI·6月11日·★★★★

カスタムエージェントハネスの構築方法

LangChain は、タスクに適切なコンテキストやデータ、環境を接続することで有用なエージェントを構築するにはカスタマイズが重要であると説明し、モデルがツールを呼び出してループ処理を行うエージェントの核心について解説している。

LangChain Blog·6月4日·★★★★

Anthropic が Claude を活用したセルフサービスデータ分析を可能にする方法

Anthropic は、自社の AI モデル「Claude」を活用することで、技術者以外のユーザーもデータ分析を自己完結で実行できる仕組みを提供している。これにより、組織内のデータ活用が加速する。

Claude Blog·6月3日·★★★★

エージェントの観測可能性:本番環境でのLLMエージェントの監視と評価方法

LLMエージェントの本番環境におけるモニタリングには、新しい観測ツールが必要である。大規模なAIエージェントのトレース、評価、改善を行う手法について解説する。

LangChain Blog·4月23日·★★★★

LLMエージェントのための適応型メモリ許可制御

研究者らが、LLMベースのエージェント向けに、長期記憶の内容を制御する適応型メモリ許可制御手法を提案した。これにより、幻覚や陳腐化した事実を含む大量の会話内容の蓄積や、高コストで監査困難な不透明なメモリポリシーへの依存を解決する。

ArXiv cs.AI·3月6日·★★★★