#レッドチーミングのAIニュース

4件の記事

重要インフラ防衛のためのAI実験

AIが重要インフラの脆弱性を特定し、攻撃前に防御する取り組み。AnthropicとPNNLが共同研究を進めている。

サイバーセキュリティ向けに微調整されていない大規模言語モデル（LLM）が、新しいツールキットを装備することで、数十台のホストを持つネットワークに対する多段階攻撃を成功させることができる。

Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。

Surge AIはAIに人間の価値観と知性を組み込むことを目指し、AIが人間の意図を理解し信頼できる世界の構築を目指している。