1件の記事
OpenAIは、AIモデルが信頼できる指示を信頼できない指示よりも優先するように教えるためのトレーニングデータセット「IH-Challenge」をリリースした。初期結果では、セキュリティとプロンプトインジェクション防御の両方で大幅な改善が見られている。