#aiセーフティ のAIニュース
3件の記事
AIの攻撃的サイバー能力は6ヶ月ごとに倍増しているとセキュリティ研究者が発見
セキュリティ研究者が、AIモデルの攻撃的サイバー能力が2024年以降5.7ヶ月ごとに倍増しており、Opus 4.6やGPT-5.3 Codexが人間専門家の3時間を要するタスクを解決できると報告した。
The Decoder·4月5日·★★★★
AI週間レビュー #336 - Sonnet 4.6、Gemini 3.1 Pro、Anthropic対ペンタゴン
AnthropicがSonnet 4.6をリリース、GoogleはGemini 3.1 Proを発表。米国防総省はAI安全対策を巡りAnthropicとの契約停止を検討。
Last Week in AI·2月24日·★★★★
AIのための核安全保障策の開発
NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。
Anthropic Red Team·8月21日·★★★★