#エクスプロイト のAIニュース
2件の記事
LLM のエクスプロイト開発能力を測定する研究
Anthropic Red Team は、AI モデルのエクスプロイト開発能力を評価する新ベンチマーク(ExploitBench, ExploitGym)およびスマートコントラクト向けベンチマーク(SCONE-bench)を用いた調査で、Mythos Preview が他モデルを上回る性能を示したと発表した。
Anthropic Red Team·5月22日·★★★★
ClaudeのCVE-2026-2796エクスプロイトのリバースエンジニアリング
ClaudeがFirefoxで発見した脆弱性の一つに対して、Claudeがどのようにエクスプロイトを作成したかを詳細に分析している。
Anthropic Red Team·3月6日·★★★★