#long-context のAIニュース
4件の記事
Claude Sonnet 5(4 分間の読み物)
Anthropic が新モデル「Claude Sonnet 5」を発表し、その性能や特徴について解説している。
TLDR AI·7月1日·★★★★
Agent Judge:生産環境向けエージェントの長期コンテキスト評価を解決(10 分読了)
TLDR AI が紹介する「Agent Judge」は、検索・検証・適応に焦点を当て、従来の LLM 判定器が苦手とする長期コンテキストや状態保持アクションの評価精度と一貫性を向上させる手法です。
TLDR AI·5月29日·★★★★
Opus 4.6とSonnet 4.6で100万トークンのコンテキスト長が一般提供開始
Anthropic社が、Opus 4.6とSonnet 4.6モデルで100万トークンのコンテキスト長を標準価格で一般提供開始した。競合のOpenAIやGeminiは長いコンテキストに対して追加料金を課しているが、Anthropicは追加料金なしで提供している点が特徴。
Simon Willison Blog·3月14日·★★★★
マルチ画像推論への準備はできているか?VHs:ビジュアル・ヘイスタック・ベンチマークの発表!
マルチ画像推論の能力を評価するための新しいベンチマーク「ビジュアル・ヘイスタック」が発表されました。
Berkeley AI Research·7月20日·★★★★