米国政府の指令に基づく Fable 5 および Mythos 5 のアクセス停止に関する声明
Anthropic は米国政府の指令に従い、AI システム「Fable 5」と「Mythos 5」へのアクセスを一時停止する方針を発表した。
キーポイント
政府指令に基づくサービス停止
Anthropic は米国の政府機関からの具体的な指令に従い、自社が運営する AI システムへのアクセスを強制的に一時停止することを表明している。
対象システムの特定
今回の停止措置の対象は、同社が開発した「Fable 5」と「Mythos 5」という特定の AI システムであることが明記されている。
コンプライアンス遵守の姿勢
企業としての自主判断ではなく、国からの指令に従って対応する姿勢を示すことで、法的・政策的な要請への厳格な順守を強調している。
影響分析・編集コメントを表示
影響分析
このニュースは、AI 開発企業が政府の安全保障や政策指令に対していかに迅速かつ厳格に従う必要があるかを示す重要な事例です。特に特定のモデル名を指定した停止措置は、今後の AI ガバナンスにおいて、技術的機能と法的規制が直結するケースが増える兆候を示唆しています。
編集コメント
企業名や製品名が明確に特定された政府指令への対応は、AI 業界におけるコンプライアンスリスクの具体化を示しており、今後の規制動向を注視する必要があります。
米国政府は国家安全保障当局を根拠に、アメリカ国内・国外を問わず、外国籍者(Anthropic の従業員を含む)による Fable 5 および Mythos 5 へのすべてのアクセスを停止する輸出管理指令を発令しました。この命令の直接的な影響として、コンプライアンスを確保するため、当社はすべての顧客に対して Fable 5 と Mythos 5 を突如として無効化しなければなりません。他のすべての Anthropic モデル へのアクセスには影響しません。
政府からこの指令を受けたのは本日午後 5 時 21 分(東部標準時)です。書簡には国家安全保障上の懸念に関する具体的な詳細は記載されていません。私どもの理解では、政府は Fable 5 を回避する、あるいは「 Jailbreaking(脱獄)」する方法を特定したと判断しているようです。私たちはこの特定の手法が、以前から知られている少数の軽微な脆弱性を特定するために使用されているデモンストレーションを確認しました。これらの脆弱性はすべて比較的単純であることが判明しており、他の公開されたモデルでも回避措置を必要とせずに同様に発見できることを確認しています。
Fable のセーフガードに関する Anthropic の姿勢は、当社のローンチ ブログ記事 に記載されている通り以下の通りです:
- 私たちは、Fable がサイバーセキュリティ関連のタスク(その他多数)に誤用される可能性を大幅に低減する強力なセーフガードを導入しました。実際、私たちのセーフガードは非常に強固であるため、多くのユーザーから「過度に広範すぎる」という苦情が寄せられています。
- Fable のローンチを迎える数週間前、Anthropic は米国政府、英国 AISI(AI Safety Institute)、複数の民間第三者組織、および社内チームと協力し、Fable のセーフガードを総計数千時間にわたってレッドチームテストしました。
- これらのテストにより、Fable のセーフガードはこれまでに展開されたどのモデルよりも実質的に効果的であることが示されました。
- 現時点で、誰一人として「ユニバーサル・ジェイルブレイク」(モデルのセーフガードを非常に広範に迂回し、幅広いサイバー機能を解放する手法)を見つけることはできていません。
- 私たちは、現在のところどのモデルプロバイダーにとっても完璧なジェイルブレイク耐性は不可能であると推測しています。業界で使用されているすべてのセーフガードは、非ユニバーサル・ジェイルブレイク(特定の状況下で一部のサイバー情報を引き出す可能性がある)に対して脆弱であり、将来的にはユニバーサル・ジェイルブレイクが発見される可能性が高いと考えられます。これは Fable 5 をリリースする際に明確に述べた通りです。
- 完璧なジェイルブレイク耐性が今日では実現不可能であると考えられるため、Anthropic は Fable 5 において「ディフェンス・イン・デプス(多層防御)」戦略を採用しました。私たちの目的は、非ユニバーサル・ジェイルブレイクの場合は狭い範囲に限定し、ユニバーサル・ジェイルブレイクの場合は生成コストを非常に高くすること、そしてこれと徹底的なモニタリングを組み合わせて、成功した攻撃を迅速に検知して停止させることにあります。これが Anthropic が Fable において顧客データの 30 日間の保持を義務付けた理由でもあります。これは顧客との関係において実際にコストがかかるポリシー変更ですが、ジェイルブレイクの調査と緩和を行うために必要な措置です。
- 私たちはこのディフェンス・イン・デプス戦略を堅持します。これにより Fable がもたらすリスクが低減され、業界全体で既に展開されている既存モデルのリスクと比較可能なレベルに抑えられています。
- 有害な結果をもたらした懸念すべき非ユニバーサル・ジェイルブレイクの開示すら、私たちはまだ受けていません。私たちに開示された潜在的なジェイルブレイクは、すべて無害な応答であるか、または Mythos に特化した向上をもたらさない些細な発見に過ぎません。
- 現時点まで、政府から提供されたのは、潜在的で狭い範囲の非ユニバーサル・ジェイルブレイクの口頭証拠のみです。これは本質的に、モデルに対して特定のコードベースを読み込み、ソフトウェア上の欠陥を修正するよう求める内容です。私たちが理解している限り、一つの潜在的なジェイルブレイクが政府に共有されました。私たちは、政府の指令の根拠であると信じる報告書をレビューし、そこで示された能力レベルが他のモデル(OpenAI の GPT-5.5 など)からも広く利用可能であり、システムを安全に保つ防御者によって毎日使用されていることを確認しました。詳細については今後 24 時間以内に共有いたします。
私たちは政府の法的指示に従い、すべてのユーザーに対する Fable 5 および Mythos 5 のアクセスを停止しました。しかし、限定的な潜在的な Jailbreak(脱獄)の発見が、数億人に展開されている商用モデルのリコール理由となるべきだと私どもは考えません。もしこの基準が業界全体に適用されるのであれば、すべてのフロンティア・モデル・プロバイダーにとって新たなモデルの展開が事実上停止されると私たちは考えています。
私たちは 公的に 表明した 通り、政府には不安全な展開をブロックする権限を持つべきだと考えています。ただし、それは透明性があり、公平で明確であり、技術的事実に基づいた法定プロセスの一環として行われるべきです。今回の措置はこれらの原則に則っていません。
お客様へのこの混乱についてお詫び申し上げます。これは誤解によるものと考えており、可能な限り早くアクセスを復旧させるよう取り組んでいます。
関連コンテンツ
最初の Anthropic パブリック・レコードからの結果
TCS と Anthropic が Claude を規制業界に導入するためにパートナーシップを結ぶ
私たちはタタ・コンサルティング・サービス(Tata Consultancy Services、以下 TCS)とのパートナーシップを発表します。TCS は 56 カ国にわたる自社の従業員 50,000 名に対して Claude を提供し、金融サービス、ヘルスケア、公共部門、およびその他の規制業界のクライアント向けに Claude を搭載した製品を開発し、Claude パートナー・ネットワークに参加します。
DXC は、銀行や航空会社、その他の規制業界が依存するシステムに Claude を統合します
私たちは、世界最大の IT サービス企業の 1 つである DXC Technology と、数年間にわたるグローバルな同盟を結ぶことを発表します。
原文を表示
The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees. The net effect of this order is that we must abruptly disable Fable 5 and Mythos 5 for all our customers to ensure compliance. Access to all other Anthropic models will not be affected.
We received the directive from the government today at 5:21pm (ET). The letter did not provide specific details of its national security concern. Our understanding is that the government believes it has become aware of a method of bypassing, or “jailbreaking” Fable 5. We reviewed a demonstration of this specific technique being used to identify a small number of previously known, minor vulnerabilities. These vulnerabilities all appear relatively simple, and we have found that other publicly-available models are able to discover them as well without requiring a bypass.
Anthropic’s posture with respect to Fable’s safeguards, as laid out in our launch blog post, is the following:
- We have instituted strong safeguards that greatly reduce the likelihood that Fable is misused for tasks related to cybersecurity (among others). In fact, our safeguards are so strong that many users have complained that they are overly broad.
- In the weeks leading up to the launch of Fable, Anthropic worked with the US government, the UK AISI, multiple private third-party organizations and internal teams to red-team Fable’s safeguards for thousands of hours in total.
- These tests showed that Fable’s safeguards are substantially more effective than those of any previously deployed model.
- No testers have yet been able to find a universal jailbreak—a jailbreak method that can very broadly bypass the model’s safeguards, unblocking a wide range of cyber capabilities.
- We suspect that perfect jailbreak resistance is not currently possible for any model provider. Every safeguard used in the industry is vulnerable to non-universal jailbreaks (which can elicit some cyber information in specific circumstances), and it is likely that universal jailbreaks will eventually be found in the future. We stated this clearly when we released Fable 5.
- Given that perfect jailbreak resistance does not appear to be possible today, Anthropic adopted a defense in depth strategy with Fable 5. We aimed to make jailbreaks either narrow (in the case of non-universal jailbreaks) or very expensive to produce (in the case of universal jailbreaks), and to combine this with thorough monitoring to quickly detect and shut down any successful attacks. This is also why Anthropic has required 30-day retention of customer data with Fable—a policy change that carries real costs for us with customers, but that allows us to research and mitigate jailbreaks.
- We stand by this defense in depth strategy. It reduces the risks posed by Fable, making them comparable to the risks of existing models already deployed across the industry.
- We have not even received a disclosure of a concerning non-universal potential jailbreak that led to a harmful result. The potential jailbreaks that have been disclosed to us are either entirely benign responses or are minor findings that provide no Mythos-specific uplift.
To date, the government has only given us verbal evidence of a potential narrow, non-universal jailbreak, which essentially consists of asking the model to read a specific codebase and fix any software flaws. Our understanding is that one potential jailbreak was shared with the government. We have reviewed a report that we believe is the basis of the government's directive and validated that the level of capability displayed there is widely available from other models (including OpenAI’s GPT-5.5), and is used every day by the defenders who keep systems safe. We will share more details over the next 24 hours.
We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people. If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.
As we have stated publicly, we believe the government should have the ability to block unsafe deployments, as part of a statutory process that is transparent, fair, clear, and grounded in technical facts. This action does not adhere to those principles.
We apologize for this disruption to our customers. We believe this is a misunderstanding and are working to restore access as soon as possible.
Related content
Results from the first Anthropic Public Record
TCS and Anthropic partner to bring Claude to regulated industries
We’re announcing a partnership with Tata Consultancy Services (TCS). TCS will provide Claude to 50,000 of its own employees across 56 countries; build Claude-powered products for clients in financial services, healthcare, the public sector, and other regulated industries; and join the Claude Partner Network.
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
We’re announcing a multi-year global alliance with DXC Technology, one of the world’s largest IT services companies.
関連記事
Anthropic、Fable 5 および Mythos 5 のアクセスを停止
AI 企業 Anthropic が、自社のモデル「Fable 5」と「Mythos 5」に対するユーザーのアクセス権限を一時的に停止したと発表した。
暗号化、スパイウェア、そしてミトス:歴史が示すサイバー輸出管理の失敗
TechCrunch AI は、過去の事例を分析し、暗号化技術やスパイウェア、AI 基盤である Mythos への規制を含むサイバー輸出管理政策が実効性を欠くことを指摘している。
米国がアンソロピックの「Fable 5」発売を禁止、しかし市場は動じず
米国政府は国家安全保障上の懸念から、アマゾンの研究者らがガードレール回避手法を発見したとして、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の販売差し止めを命じた。サイバーセキュリティ研究者らはこの措置が危険だとする公開書簡に署名し、同社も他モデルでも同様の抜け道が存在すると指摘している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み