#penetration testing のAIニュース

2件の記事

脆弱なアプリを構築し、LLM がハッキングできるか 1,500 ドルかけて検証した結果（9 分読み）

開発者が脆弱な書籍レビューアプリを作成し、大規模言語モデルがユーザーの非公開レビューからフラグを取得する攻撃を実行できるかを検証しました。GPT-5.5 が最も成功し、10 回中 7 回で任務を達成しましたが、Claude Sonnet 4.6 はコスト高かつ成功率低でした。

Anthropic は、パートナー企業らが自社の AI モデル「Opus」をサイバーセキュリティ対策にどのように応用しているかを紹介した。