#penetration testing のAIニュース
2件の記事
脆弱なアプリを構築し、LLM がハッキングできるか 1,500 ドルかけて検証した結果(9 分読み)
開発者が脆弱な書籍レビューアプリを作成し、大規模言語モデルがユーザーの非公開レビューからフラグを取得する攻撃を実行できるかを検証しました。GPT-5.5 が最も成功し、10 回中 7 回で任務を達成しましたが、Claude Sonnet 4.6 はコスト高かつ成功率低でした。
TLDR AI·6月4日·★★★★
パートナー企業がサイバーセキュリティにOpusを活用する方法
Anthropic は、パートナー企業らが自社の AI モデル「Opus」をサイバーセキュリティ対策にどのように応用しているかを紹介した。
Claude Blog·5月21日·★★★★