2件の記事
Eugene Yan が、効果的なサイバーセキュリティ評価システムを設計・実装するための具体的なパターンや手法について解説している。
StrongREJECTベンチマークを事例に、AIモデルの安全性を回避するjailbreak手法の効果的な評価方法を検討する研究について説明します。