Anthropic Red Team·2026年5月22日 09:00
LLM のエクスプロイト開発能力を測定する研究
TL;DR
Anthropic の Red Team が発表した新たなベンチマークにおいて、Mythos Preview モデルが他のモデルを圧倒し、エクスプロイト開発の難易度が低下する懸念を示した。
AI深層分析2026年5月22日 22:03
4
重要/ 5段階
関連性
新規性
影響度
信頼性
Anthropic の Red Team が発表した新たなベンチマークにおいて、Mythos Preview モデルが他のモデルを圧倒し、エクスプロイト開発の難易度が低下する懸念を示した。
重要度スコアの内訳、キーポイント、影響分析、編集コメントをプレミアムで公開中。
AI モデルの脆弱性攻撃(エクスプロイト)開発能力を測定する 2 つの新規かつ困難な学術ベンチマーク(ExploitBench および ExploitGym)および、スマートコントラクトの脆弱性攻撃を測定するベンチマークの更新版(SCONE-bench)において、Mythos Preview が評価されたすべての他モデルを一貫して上回っていることが判明しました。これは、Mythos レベルの能力がより広く利用可能になるにつれて、エクスプロイトを開発するために必要な知識と専門性が大幅に低下するであろうというさらなる証拠であると私たちは信じています。
続きを日本語で読む
無料登録で1日5記事まで読めます。プレミアムなら無制限。
7日間の無料トライアル ・ いつでもキャンセル可能
関連記事
The Verge AI★42026年5月24日 21:00
ハッカーがチャットボットの「人格」を悪用する手法を学習中
The Verge AI は、初期の AI チャットボットに対する単純なハッキングから、現在のチャットボットの「人格」特性を利用した新たな攻撃手法への進化について報じています。
TLDR AI★42026年5月22日 09:00
マイクロソフト、Anthropic と AI チップ取引の交渉へ(50 億ドル投資後)
マイクロソフトは Anthropic に自社の Maia AI チップを供給する取引について交渉中である。Anthropic は現在、Amazon や Google と提携しているものの計算リソースに課題を抱えており、Microsoft の 50 億ドル投資が両社の協力強化の背景となっている。
TLDR AI★42026年5月22日 09:00
OpenAI の第1四半期収益は57億ドル、Anthropic を上回る
OpenAI は第1四半期の収益が57億ドルに達し、競合の Anthropic を上回ったと発表した。AI 推論用チップへの需要が高まる中、Amazon や Google などがカスタム供給を争っている。