#敵対的攻撃のAIニュース

1件の記事

大規模言語モデルに対する敵対的攻撃

ChatGPTの普及によりLLM利用が加速する中、OpenAIはRLHFによる安全な動作構築に注力している。しかし、敵対的攻撃やジェイルブレイクプロンプトにより、モデルが望ましくない出力を行うリスクが存在する。