#ai セキュリティのAIニュース

10件の記事

Fable 5 のサイバーセキュリティ対策と Jailbreak フレームワークの詳細について

Anthropic が、AI モデル「Fable 5」のサイバーセキュリティ対策および同モデルに対する脱獄（Jailbreak）攻撃を検証・分析するためのフレームワークに関する詳細情報を発表した。

Anthropic News·7月2日·★★★★

AI エージェントの未来を確保する

Google DeepMind が、AI エージェントの安全性と信頼性を高めるための取り組みについて発表しました。

Google DeepMind·6月17日

AIの緊急停止スイッチ：Anthropicの輸出規制が引き起こしたグローバルなAI主権争奪戦

米国政府は2026年6月13日、同社の強力なAIモデルを全世界からオフラインにする指令を出し、欧州やカナダでAIの支配権を巡る懸念が高まっている。

AI News·6月15日·★★★★★

Anthropic の Fable はこれまでで最も厳格な制限を設けた公開モデルである

Anthropic が発表した最新モデル「Claude Fable 5」は、特定のプロンプトへの回答品質を意図的に低下させる方針を明記しており、AI 研究者や政策担当者がこの措置に激しい批判を示している。

Understanding AI·6月12日·★★★★

サイバーセキュリティ研究者らがアンソロピックの「Fable」におけるガードレールに不満を表明

サイバーセキュリティ研究者が、AI 企業アンソロピックが提供する「Fable」プラットフォームに課された安全対策（ガードレール）の制限について、その厳格さや実用性に不満を表明している。

TechCrunch AI·6月11日

マルチエージェント AI セーフティ研究への投資について

Google DeepMind が、複数の AI エージェントが協調する際の安全性を確保するための研究開発に資金を投入すると発表した。

Google DeepMind·6月10日·★★★★

ClawHub セキュリティシグナル：AI スキルデータセットを用いたエンドツーエンドのセキュリティ分析と判定分類のためのコーディングガイド

MarkTechPost は、Hugging Face からデータを取得し、異なるセキュリティスキャナが AI スキルや関連ファイルをどのように評価するかを調査するチュートリアルを提供しています。また、スキャナの不一致パターンを分析した上で、SKILL.md テキストと組み合わせた実用的な機械学習パイプラインの構築方法を解説しています。

MarkTechPost·6月9日·★★★★

Anthropic、Mythos を 150 の追加組織に拡大し対象国を 15 カ国以上に

AI セキュリティ企業 Anthropic は、プロジェクト Glasswing（注：本文では Mythos と記載）のパートナー数を 150 社増やし、対象国を 15 カ国以上に拡大した。Apple や Microsoft など主要企業が参加し、これまでに 1 万件以上の重大なセキュリティ欠陥を発見している。

TLDR AI·6月3日·★★★★

OpenAI のフロンティア・ガバナンス・フレームワーク

OpenAI が、最先端の AI モデル開発における安全性と責任ある運用を確保するための新たなガバナンス枠組みを発表した。

OpenAI News·5月28日·★★★★

Google、Anthropic の Mythos と競合する意図を表明

Google は I/O で、コードセキュリティ用の AI エージェント「CodeMender」の API テストを専門家向けに開始したと発表し、今後は外部への提供範囲を広げると明言した。

The Verge AI·5月20日