#ai セキュリティ のAIニュース
10件の記事
Fable 5 のサイバーセキュリティ対策と Jailbreak フレームワークの詳細について
Anthropic が、AI モデル「Fable 5」のサイバーセキュリティ対策および同モデルに対する脱獄(Jailbreak)攻撃を検証・分析するためのフレームワークに関する詳細情報を発表した。
AI エージェントの未来を確保する
Google DeepMind が、AI エージェントの安全性と信頼性を高めるための取り組みについて発表しました。
AIの緊急停止スイッチ:Anthropicの輸出規制が引き起こしたグローバルなAI主権争奪戦
米国政府は2026年6月13日、同社の強力なAIモデルを全世界からオフラインにする指令を出し、欧州やカナダでAIの支配権を巡る懸念が高まっている。
Anthropic の Fable はこれまでで最も厳格な制限を設けた公開モデルである
Anthropic が発表した最新モデル「Claude Fable 5」は、特定のプロンプトへの回答品質を意図的に低下させる方針を明記しており、AI 研究者や政策担当者がこの措置に激しい批判を示している。
サイバーセキュリティ研究者らがアンソロピックの「Fable」におけるガードレールに不満を表明
サイバーセキュリティ研究者が、AI 企業アンソロピックが提供する「Fable」プラットフォームに課された安全対策(ガードレール)の制限について、その厳格さや実用性に不満を表明している。
マルチエージェント AI セーフティ研究への投資について
Google DeepMind が、複数の AI エージェントが協調する際の安全性を確保するための研究開発に資金を投入すると発表した。
ClawHub セキュリティシグナル:AI スキルデータセットを用いたエンドツーエンドのセキュリティ分析と判定分類のためのコーディングガイド
MarkTechPost は、Hugging Face からデータを取得し、異なるセキュリティスキャナが AI スキルや関連ファイルをどのように評価するかを調査するチュートリアルを提供しています。また、スキャナの不一致パターンを分析した上で、SKILL.md テキストと組み合わせた実用的な機械学習パイプラインの構築方法を解説しています。
Anthropic、Mythos を 150 の追加組織に拡大し対象国を 15 カ国以上に
AI セキュリティ企業 Anthropic は、プロジェクト Glasswing(注:本文では Mythos と記載)のパートナー数を 150 社増やし、対象国を 15 カ国以上に拡大した。Apple や Microsoft など主要企業が参加し、これまでに 1 万件以上の重大なセキュリティ欠陥を発見している。
OpenAI のフロンティア・ガバナンス・フレームワーク
OpenAI が、最先端の AI モデル開発における安全性と責任ある運用を確保するための新たなガバナンス枠組みを発表した。
Google、Anthropic の Mythos と競合する意図を表明
Google は I/O で、コードセキュリティ用の AI エージェント「CodeMender」の API テストを専門家向けに開始したと発表し、今後は外部への提供範囲を広げると明言した。