かつての物語と未来の物語 #2(37 分読み)
米国政府が Anthropic の生成 AI モデル「Fable」および「Mythos」に対して、根拠の薄いセキュリティ懸念を理由に強制アクセス停止と輸出規制を科した事案は、AI 業界における規制の不透明性と技術的誤解による重大な前例を示している。
キーポイント
政府による強制アクセス停止と輸出規制の発動
ホワイトハウスが Anthropic のモデル「Fable」および「Mythos」へのアクセス停止を要求し、拒否された場合に備えて輸出規制を即時発動させ、結果として全ユーザーの利用を強制的に停止させた。
技術的誤解に基づく根拠の薄い規制判断
政府は狭義のジールブレイク(抜け道)を発見したと主張したが、同様の出力は GPT-5.5 などの他社モデルでも標準的に生成可能であり、 Anthropic が「修正すべき状況ではない」と説明してもホワイトハウスは聞き入れなかった。
AI 規制のハプハザード(場当たり的)な実態
高性能モデルがリリースされた直後に規制が適用される事態により、技術的な実情を無視した政府の対応が結果的に社会全体の知能レベルを低下させる(世界を「愚か」にする)という批判が専門家の間で広がっている。
不透明な動機と今後の不確実性
政府がこの決定に至った具体的な動機、技術理解の欠如度合い、そして今後「狭義の修正」を求めるのか「グローバルな禁止」を求めるのかは依然として不明であり、業界全体に不安を残している。
影響分析・編集コメントを表示
影響分析
この事象は、AI 規制当局が技術的実態を十分に理解していないまま政治的判断で業界を動かすリスクを如実に示しており、開発企業にとって予測不能な規制リスクが高まっていることを意味します。また、輸出規制という強力な手段が即座に発動される可能性は、グローバルな AI 開発と流通における不確実性を増大させ、業界全体のパフォーマンス低下やイノベーションの阻害を招く恐れがあります。
編集コメント
技術的正当性が乏しいまま政府が介入し、輸出規制という強力な手段でサービス停止を強行した事例は、AI ガバナンスの在り方に対する深刻な警鐘です。開発企業にとっては、技術的な説明が通じない政治的判断にどう対峙するかが新たな課題となっています。
金曜日の夜、米国政府はアンソロピックに対し、Fable および Mytho へのすべてのアクセスを停止するよう強制しました。
週末は非常に厳しいものとなりました。
ディーン・W・ボール氏: 極めて高性能なモデルがリリースされた直後に、AI 規制が場当たり的に課されることの一つの側面として、非常に現実的な意味で政府は私の世界を*より愚か*にしてしまったという点があります。一般的に政府に対しては印象論的な意味でほぼ常にそう思うことがありますが、今回はそれが文字通りの事実となりました。
さらに詳細が明らかになりました。戦場の霧(fog of war)のような不透明な部分もまだ残っていますが、Claude Fable や Mythos が深く愚かな判断によって停止された理由について、私たちはかなり良い理解を得ています。
- 狭い Jailbreak(脱獄)が発見されました。これは Anthropic が事前に警告していた、明らかに存在するタイプのものです。示されたすべての出力は、GPT-5.5 が Jailbreak やバイパスなしでさえも、単に生成できるだけでなく、実際に生成しうるものです。
- ホワイトハウスは Anthropic に Fable を削除して状況を「修正」するよう求めましたが、Dario が修正すべき状況など存在しないと説明しようとしても聞き入れませんでした。
- Anthropic がこれに従わなかったため、ホワイトハウスは Fable と Mythos を全員のために停止させることを確実に知っていた輸出規制を科しました。多くのニヒリストはこの決定を正当化し、Anthropic を非難していますが、彼らはすべてが デーン・ボールの描く米国政府像、つまり我々が適切に慰めなければならない死にかけている NPC のホスピス患者 に忠実であり、適切な雰囲気と屈伏によって攻撃されないようにしていることを確認しています。ただし、彼らはこれを強さと正義と同一視しています。なぜなら「力こそが正義」であり、権力と雰囲気がすべてだからです。
これは急速に展開する物語で、スピードの優位性が大きいため、誤りや構造が理想的でないことについてお詫び申し上げます。我々はできる限りのことをします。
我々が知らないことは以下の通りです:
- 政府がこれらの決定を下した動機は何だったのか。
- これらの仕組みについて、彼らがどれほど深く混乱しているのか。
- 彼らは狭義の修正を要求しているのか、それとも包括的な修正を要求しているのか。狭義の修正はおそらく容易である。包括的な修正はおそらく不可能である。
- 次に何を意図しており、何を実現しようとしているのか。
良い結果となるのは、これが深刻な誤解であり、パニック反応の表れであって、すぐに整理がつき、その後アクセスを回復できる場合である。あるいは、彼らが十分な圧力に直面し、すぐに間違いに気づく場合や、Anthropic がそれが愚かなことであっても懸念を迅速に和らげる何かを行える場合である。
それでも、アメリカの AI に対する信頼、ビジネス環境、重要な外国の AI 人材を採用する能力、アメリカと同盟国との関係、Project Glasswing の進展およびサイバーセキュリティ、そして法の支配に対して、多くの恒久的な損害を伴うひどい先例が作られることになる。
朗報、あるいは大きな希望は、実際に行動が必要な時に、我々は経済的・政治的な多大なコストを払うことになっても、行動することを恐れないことを示した点にあります。時には国家安全保障やその他の懸念によって要請が生じ、それを満たすためにシャットダウンせざるを得ない場合もあるでしょう。それは厳しい現実です。これは安全推進派が選択肢として提案する範囲をはるかに超えた行為であり(極めて稀な例外を除き)、実際に実行されました。したがって、そのような状況において「諦めろ、政府は決して[X]をしない」と言うことはもはやできません。
また、行動が必要な前に、いかにして適切に行動するかを見極める必要性も強調しています。もしそのような状況に陥り、[X]を行う適切な方法を持たなければ、[X]を無謀で散漫かつ甚大な破壊をもたらす形で実行してしまう可能性が高いからです。したがって、今すぐ交渉の組み立て方や一時停止の実施、特定のモデルの撤廃などについて検討を開始すべきです。
最悪の結果は、これが深刻な誤解ではなく、他の要因によって動機付けられており、迅速に解決できない場合です。政府が実際には、あなたに対して反論してはならないと考える独裁的な単一行政権力によって、アメリカの主要なAI研究所を強制的に掌握しようとする方向で急速にエスカレートしている可能性があります。彼らが「ジャンプしろ」と言うとき(あるいは株式の提出やその他の要求をするとき)、誰もが「どのくらい高く飛びますか?」と尋ねるべきであり、そうでなければという脅しです。
⟦CODE_0⟧
また、現時点ではありそうにないものの、第3の可能性として、ホワイトハウスが正しく、脅威は現実のものであり、これは緊急事態であったというケースも考えられます。それがダリオやアンソロピックに対してリアルタイムでどのように正当化されたか、あるいは現在どのように正当化されているかは別としてです。もしかすると、この対応自体が危険だったのかもしれませんし、他の危険に対するリスクが高すぎた可能性もあります。
技術的な主張を検証するまで、これを否定することはできません。また、次回は企業が正しく政府が間違っているという前提も取るべきではありません。いずれ「これは大丈夫だ」と主張する企業が出てくる時期が訪れる可能性があり、その時こそ非常に大きな誤りとなるでしょう。
もしこれが真実であることが証明されれば、アンソロピックはあらゆる面で多大な信頼を失うことになります。これも私がこのシナリオを極めてありそうにないと考える理由の一つです。ここでは間違えることは許されないのです。
- 何が起きたか:結論。
- アマゾンがホワイトハウスに電話する。
- 政府がパニックになる。
- より愚かなバージョン。
- ウェルネス・リトリートは存在しなかった。
- 脅威を明確にする。
- 中国はミソスをアクセスしていたのか?
- アンソロピックは依頼された際にファブルをオフラインにするべきだったのか?
- はい、これはファブルに対する排除命令でした。
- 私たちは、DoW の闘争が関連しているとは言っていません。しかしながら。
- 虚無主義者たち。
- 主に無害。
- 全員が全員を指します。
- これが最良のシナリオであり、ほとんどが誤解だった可能性があります。
- 次のステップ。
- 最悪のライセンス制度は完全に場当たり的です。
- 私たちは信頼できないパートナーであることを示しています。
政府自身の見解では、アンソロピックの対応における『真剣さの欠如』が、政府による輸出管理措置の発動につながったとされています。
もし Axios や Politico を信じるなら、『真剣さの欠如』とは、アンソロピックが以下を行った時を指します:
- ファブルを即座に削除し、極めて従順かつ真摯に対応しなかったこと。
- GPT-5.5 でも不可能ではないジョークブレイクに対して対応したこと。
- 詳細は一切提供されなかったこと。
- その代わりに事件の詳細を問い合わせたこと。
- 金曜日の午後、90 分以内のことでした。
つまり、本質的には『アンソロピックは理由がある場合のみ行動しようとする。したがって、雰囲気がおかしいと判断し、誰がボスかを示すためにすべてを吹き飛ばそう』という状況だったのです。
これは、金曜日の午後5時直後に「特定の時刻にダリオ氏に連絡が取れなかったため、米国の AI 政策をすべて白紙に戻さなければならなかった」という言い訳が二度目として持ち出されたケースでもあります。この言い訳は、エミル・マイケル氏によっても用いられていました。
今回は、彼が「ウェルネス・リトリート(健康回復のための滞在施設)」にいたという主張ですが、アンソロピック社はこれを明確に否定しており、そこにいたアシュリー・ヴァンス氏も明確に否定しています。
アンソロピック社によると、ダリオ氏の要請から 75 分後に彼が利用可能になったとされ、その間には他の上級役員も対応したとしています。私はこの説明を信じています。
ホワイトハウスは、アマゾンからの連絡を受けてからダリオ氏への接触を試みるまで、75 分以上も待ったどころか、一晩中待ちました。
出来事とタイムラインの詳細が次々と明らかになっています。まず Axios の報道から:
**マリア・クリ(Axios):
裏側で:** 当局に詳しい情報筋によると、アマゾンは木曜日の夜に行政関係者に電話をかけ、自らがアンソロピック社の強力な新モデル「Mythos」の一部を脱獄し、アクセスすることに成功したことを示す報告書を共有しました。このモデルは国家安全保障上の脅威となる可能性があります。
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等)は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
- Anthropic は以前、政府に対して Fable の 6 月 9 日リリース計画について複数回通知していた。Fable は Mythos の汎用バージョンであるが、会社に近い情報筋によると、政府はこれに異議を唱えなかった。
- しかし、Amazon からの電話に加え、少なくとも他の 5 つの企業から木曜日の夜と金曜日の朝にかけて、さまざまな上級行政当局者への連絡が行われた結果、モデルは金曜日の夜までに停止された。
Amazon がホワイトハウスが Fable の撤収につながる措置を開始する原因となった中心的な呼び出しの一つであることが確認されている。
前回の議論で述べた通り、Anthropic のリリース発表には、Amazon が行ったようなレベルの Jailbreak(制限突破)が可能であることを明確に警告する内容が含まれていた。彼らが行政当局に対してそのような詳細について徹底的に説明したことは疑いの余地がない。
Fable 5 リリース発表から出されたこのグラフを覚えている人はいるだろうか?
なぜ Amazon の CEO がこれについてホワイトハウスに電話をしたのか、私は理解できない。そこには私たちが知らない重要な情報が含まれているはずだ。
Anthropic は Amazon からの最初の連絡から 24 時間未満の猶予しか与えられず、実際に問題が発生しているという具体的な詳細も提示されなかった。その結果、典型的な「金曜日の午後 5 時以降」の命令が下された。この 24 時間未満の間、政府は Anthropic にこれについて連絡を試みたことはほとんどなかった。
⟦CODE_0⟧
ホワイトハウス内部の筋によれば、たとえ彼らの物語を完全に信じたとしても、彼らは 90 分間のやり取り(こちら)や一連の電話会談(こちら)で得た「雰囲気」を好まなかったため、米国の AI 全体を吹き飛ばすリスクを冒してでも決断したと確認されています。
ソフィア・C とシェイニー・ハスレット: 財務長官スコット・ベッセントやホワイトハウスサイバー担当官ショーン・ケアインクロスを含む行政当局者との間でアンソロピック CEO のダリオ・アモダイ氏と複数の緊張した電話会談が行われた後に実施されたこの措置は、ホワイトハウスが急速に進化する可能性のある危険な AI モデル(artificial intelligence models)の規制にリアルタイムで格闘している様子を浮き彫りにしています。
… 会議後、行政当局者はアモダイ氏に連絡を試みましたが、彼はウェルネス・リトリート(wellness retreat:心身の健康回復のための滞在施設)に参加中であるため利用できないと伝えられたと、行政当局者の一人およびホワイトハウスの上級職員が述べています。
アンソロピックの広報担当者は、彼がウェルネス・リトリートにいるという主張を否定し、「これは完全に誤りである」と述べました。
アンソロピックに近しい人物によると、アモデイ氏は正午頃にまず要請を受け、1 時間 15 分以内に高官らと電話で連絡が取れたという。同人物は、彼が不在の間、アンソロピック側は彼の代わりに他の上級リーダーを提案したと話している。
行政当局がついにアモデイ氏に連絡を取った際、彼はケインクロス、ベッセント商務長官ハワード・ルトニックらを含む約 6 名の行政高官との組み合わせで、3 回の通話に参加したと、ホワイトハウスの上級職員および行政当局者の一人が語っている。
…通話中、アモデイ氏は自分が誤解だと考えていた点を解消しようと努めた。彼は行政当局の懸念に反論し、ガードレール(安全装置)を擁護するとともに、発生した回避行為はアンソロピックが設置したすべてのガードレールなしで利用可能にする広範な「 Jailbreak(脱獄)」とは異なるリスクをもたらすものではないと主張した。
ダリオ氏はこれが限定的な問題だと説明しようとしたが、相手方は理解しようともしなければ信じる気もないか、あるいは理解しない・信じないことを選んだのだ。
私たちが今知っているのは、ダリオ氏がこの問題が限定的で無害であると完全に正しかったということだ。
ダリオ氏が誤っていたのは、自分が話していた相手が彼の伝えようとする内容を理解する能力と関心を持っていると想定したことである。
ホワイトハウスの高官および行政当局者2名によると、彼らはアンソロピックに対し、モデルを自主的に削除し、政府と協力して脆弱性に対処するよう要請した。 アモデイはより多くの時間と情報を求めたが、モデルの撤回については何らの約束もせず、ある時点でベッセントはアモデイに対して直接、「それは『悪い決定』だ」と述べたと、ホワイトハウスの高官は語っている。
…「数時間にわたり我々と協力するよう懇願した末に、輸出管理措置という最終手段に出たのだ」と、ホワイトハウスの高官は述べた。「これは望んで行なったことではないが、我々の手は縛られていたのだ。」
発表後、アンソロピックに近い人物の一人は、同社が行政当局と自主的に協力する選択肢を与えられたとの主張に異議を唱えた。
「ホワイトハウスは、実際の脅威に関する詳細も示さず、90分以内にモデルを削除するよう命じた」とその人物は述べた。「我々と協力するよう懇願したり、求めたりしたことは一度もない。ただ、90分という期限が宣言されただけだ。」
タエ・キム: FT が確認:「同社に近い人物によると、アンソロピックは命令発令前に詳細な懸念事項を提示されず、遵守のために90分を与えられた。」
ホワイトハウスが「数時間にわたり懇願した」と考えるか、それとも単に言葉遊びをしており、せいぜい「まだ公式の命令を出していない」という暗黙の表現に過ぎないと考えるか。
⟦CODE_0⟧
私はここで Anthropic の主張を信じない理由が見当たりません。Dario はこれが誤検知であると説明しようと試み、詳細の提供を求めました。しかしホワイトハウスは、彼らの主張を裏付ける詳細も、それが必要かつ慎重な措置であることを示す証拠も一切提示しませんでした。彼らは単に「90 分以内に Fable を削除せよ」と述べたのみで、おそらくこれが『さもなくば IFAR(国際金融規制当局)の介入』を意味するものであることを明確にしなかったのでしょう。
どうやら彼らを怒らせたのは、主に Anthropic が指示されたからといってただ高く飛び上がるのを待つのではなく、理由を求めようとした点にあるようです。
つまり、彼はどんな状況であっても、単に『どこまで高く飛ぶか』を問うことにコミットしなかったのです。
Axios によると、結論として政府の意向に詳しい情報筋は、「Anthropic が Fable のリリースに対して真剣さを欠いていた」と述べています。
- 「Anthropic がこれを真摯に受け止め、孤立した事象として片付けるのではなく、修正やアクセス停止へと動き出していれば、このような事態は決して起こらなかったでしょう」と情報筋は述べ、さらに『彼らは過信しすぎた』と付け加えました。
つまり、『お前たちは間違っている』と言われたのです。それは彼らが真剣ではないことを意味します。財務長官よりも状況の深刻さを理解できるはずがありません。
さっと追いつくために: 金曜日の午後 1 時(東部時間)、Anthropic は政府から電話を受け、"国家セキュリティ上の脅威"を理由に、Mythos および Fable モデルのリリースをロールバックするよう指示されましたが、それ以上の詳細は提供されなかったと Anthropic の情報筋は述べています。
- 「脅威の具体的な性質を直ちに理解し、それに対処できるようにしたかった」と出所は語ったが、政府は要求に屈しなかった。
Anthropic 出所: トランプ政権は金曜日に、同社に対してライセンス制度を導入する前に最も強力なモデルを削除するよう 90 分を与えたという。これは Anthropic の出所による。
Miles Brundage: 確かに、これは攻撃的な仕打ちのように聞こえる。
そしてこれが「良い」バージョンだ。「悪い」バージョンは、Chubby がここで説明しているように、またAxios も明確に示唆しているように、ホワイトハウスは単に小競り合いをしており、Anthropic が理由を求めたことや、反対の政治的見解を持つ人材を採用したことで「裏切られた」と考えているのだ。これは、これらの人々がどのように思考しているかを非常に示唆的に表している。
なぜ重要か: 世界で最も重要な技術を統治することは、トランプ大統領の言語を話すことに帰着しつつある。
- アンソロピックは、最近のサイバー行政命令を「尊重しなかった」として、政府高官が主張しており、同社がこの問題を真剣に受け止めなかったとされることが原因で、最も強力な製品がインターネット上から削除された。
- 「誰もがアンソロピックが悪者だと言っていた。一部の者は、彼らに機会を与える時だと主張した。今、その人々が疑問を抱いている。彼らは我々を裏切った」と政府高官は語った。
…
舞台裏:「アンソロピックは、行政当局と対話し、イデオロギーの違いを理解しようとする点で、大きな成果を上げていない」と、行政当局の考えに詳しいある情報筋は述べた。
- 「まるで異なる言語を話しているかのようだ」とその情報筋は付け加え、同社はこの行政当局とのコミュニケーション方法をまだ見つけていないだけだと指摘した。
…
この対立が勃発する以前にも、アンソロピックとペンタゴンの間の過去の争いも、ある意味では単に交渉テーブルの向こう側にいる人物を好まなかったことに帰着していた。
- ホワイトハウスの高官は Axios に対して、ペンタゴンとの争いは全く無関係であると語ったが、Anthropic の効果的なコミュニケーションの欠如は、同様に役立たない形で浮き彫りになった。
- 「私たちは決してこのような事態を望んではいません。私たちの最優先事項はイノベーションですが、手が出せませんでした」とホワイトハウスの高官は述べた。
- 世間の反応が火に油を注ぐ結果となった。Anthropic はアマゾンの報告書を却下するブログ記事を公開し、その後同社は行政当局によって「過激な民主党員」と見なされているサイバーセキュリティの専門家を起用した。その専門家は後に、トランプ氏が解雇したばかりのクリス・クレスに称賛された。
ホワイトハウスは、Anthropic のセキュリティ専門家が「過激な民主党員」であることに不満を抱き、ホワイトハウスはそのことを「彼らが我々を裏切った」と解釈し、現在は悪意ある行為者として扱うべきだと考えている。
このような事態に対するすべての側面の愚かさは計り知れない。これは本来重要視されるべきことではないが、Anthropic にとって非常に愚かな過失となるだろう。確かに、これらの人々は政治的視点に執着しているため、彼らと直接対峙する際には、この状況が完全に非政治的でありその懸念が無意味であるにもかかわらず、これらの人々を刺激しない人物を送り出すことを優先する必要がある。つまり、これは誰にとっても責任の問題なのだ。
**Ashlee Vance: Anthropic は過去 2 年間で AI の発展を劇的に推進してきた。現在、同社は米国 AI テクノロジーの最高峰である。
連邦政府は、ダリオ・アモダイが彼らのすべての要求に応じないことを好ましく思っていない。そのため、ホワイトハウスが「ダリオはウェルネス・リトリートにいて連絡が取れない」といった笑える主張をあらゆる記者に吹き込み、ソビエト式のプロパガンダ部分へと移行している最中だ。いい加減にしろ。
AI において米国が自滅することはないと願っていたのだが、中国に対する米国の最後の希望の一つだからな。だが、今や私たちはすでにその状況にある……
これら一連の出来事は数週間前のことではない。私は金曜日に Anthropic の本社で報道しており、この事態が展開する現場にいたのだ。ダリオはウェルネス・リトリートにはいない。連邦政府は再び Anthropic を見せしめにしようともがいているようだ。
これは技術的な問題ではない。些細なことに過ぎない。
Anthropic は何が根本的な不満の原因なのかを突き止めようとしていたが、それを行うための時間はあまり与えられていなかったようだ。お気づきかもしれないが、これほど合理的で誠実な政権とは限らないことはご存じだろう。
Teortaxes: 私は名誉毀損を非難する
「ダリオはウェルネス・リトリートにいる」という主張は、ヘグセットのような残酷なサルによって作られた、ステレオタイプに駆り立てられたでたらめである。ダリオは狂信的な創設者兼 CEO であり、ヒッピーではない。明らかに緊張している状況が Fable で展開されている最中に休暇に行くはずがない。
⟦CODE_0⟧
ダリオがウェルネス・リトリート(wellness retreat)にいたとは、私は非常にありえないことだと考えていますが、仮にそうだったとしても、CEO が 4 時間電話に出られず、誰かに権限を委譲しただけで、米国の AI 政策全体をぶち壊すようなことはしないはずです。これが一体いつの時代ですか、2029 年でしょうか?
ホワイトハウスと Anthropic の間には、多くの誤解が生じていました。
報道によると、ダリオ・アモダイは Fable を自発的に削除するよう求められた際、「悪い決断をしている」と告げられましたが、彼はより詳しい情報を求めることで拒否しました。
問題は、この言葉が何を意味するかです。それは「我々は怒るぞ」を意味するかもしれませんし、「これはお前の責任だ。何かあればお前のせいだ」という意味かもしれません。
もしダリオが、説明の余地を残すのではなく、明確に「Fable は今日オフラインになる。今すぐこれを自発的に行うことに同意しないなら、輸出管理規制で叩き潰し、完全にやられるぞ」と告げられていれば、この一連の事態はすべて回避できたのではないでしょうか?
私はわかりません。しかし、私の推測では、おそらくそうだったでしょう。
以前にその選択肢が提示されていたことを私は noticing しました。Axios の記事によると:
ホワイトハウスによれば、同政権は数週間前、Anthropic が中国共産党と直接的なつながりを持つ外国の組織に対して、最先端の Mythos モデルを提供していることを知り、輸出管理規制で脅迫したとされています。
The administration first** threatened Anthropic with export controls a couple of weeks ago after learning that its cutting-edge Mythos model was made available to an entity in a foreign country with direct ties to the Chinese Communist Party, according to the White House.
Financial Times、Verge、そしてSemaforを通じて、「中国と関連のあるグループ」が Mythos にアクセスしたことをホワイトハウスが把握したという主張がある。私の疑念としては、これは直前に言及された以前のインシデントとの混同ではないかということだ。どちらの可能性もあるだろう。
Mythos へのアクセス権限を付与するパートナーシップが 100 を超える場合、少なくとも時折そのような事態は確実に起こり得る。アクセス制御には限界がある。重要なのは、侵害されたアクセスが発見され閉鎖されるまでに何が可能かを封じ込めることだ。報告書では「アクセスされていた」と記されており、「継続的にアクセス権を有していた」とは記されていない。
これを理由に Mythos を一時的に Glasswing 内のコアグループのみを対象としたり、場合によっては一時停止したりするよう求めるのは、狂気ではないが過剰反応である可能性が高い。ただし、それは Fable には影響しないだろう。
これが「雰囲気の悪化」問題の一因となったか、あるいはこれら二つの事象の関係性について混乱があったのかもしれない。
見てくれ。そうだ。間違いはあった。私はここで「Anthropic は何も悪いことをしていない」という立場の人ではない。
できるなら説得してやめさせるように努めるが、相手が譲らない場合は、それが馬鹿げたほど愚かで高価であり、ある種の仕掛かり攻撃(ヒット・ジョブ)になりかねないとしても、実行するしかない。
そして、私は彼らがその点においてある程度の責任を負っていると考えます。また、彼らはさまざまな方法でホワイトハウスをよりよく「処理」できたはずです。誰を送り込んだかという点も含まれます。
あなたは、複数のレベルで、指示された際にモデルをダウンさせるという先例を立てる必要があります。そして、それは政府が潜在的なセキュリティ上の懸念を提起したからだと説明し、少なくともそれがすぐに解決しないことが明確になるまでそうするのだと述べるべきです。
後から見れば、これはさらに明白です。しかし、一度行われたことは取り消せません。
その点は理解できます。要求は根拠がなく、不合理で、急かされたものでした。人々は自分が何について話しているのか全く分かっておらず、彼らは本当に、これが共和国ではないかのように、ただ自分の命令に従うようあなたに命じているのです。それは許されません。誰もそんな愚かなことをするはずがありません……はい。はい。
また、Fable のローンチがやや急ぎ足であったことを示す様々な兆候もあります。
Miles Brundage: 管理チームは、素朴な読者にはこれが合理的な決定だったように聞こえるような、あらゆる詳細を漏らし続けるでしょう。
しかし、CAISI や NSA のドメインエキスパートが関与したことを示す兆候はゼロです。すべての報道ポイントは「ホワイトハウスの上級職員」を指しています。
そのような兆候に最も近いのは、 Jailbreak 研究(※: セキュリティの抜け道に関する研究)が「セキュリティ研究者」と共有されたという主張だけです。
しかし、これが意思決定に影響を与えたという兆候はなく、引用された独立した研究者 1 人も Anthropic と見解を一致させています。
明確に言っておきますが、「Fable の発表は急ぎすぎた」という合理的なケースを想像することは十分にあり得ると私は考えます。脅威モデリングや費用対効果分析などは難しいものです。
一方で、「これは明らかに悪質であり、かつ 5.5 は(そしてまもなく 5.6 も)明らかに良いものである」という明確なケースの方が、可能性は低いです。
Nathan Lambert: +1、雰囲気がそう言っています
もし CAISI の責任者がチームに相談し、Fable へのアクセスを制限する必要があると考え、脅威が深刻であると信じていると聞けば、私はそれをより信じやすくなるでしょう。しかし、商務省が単独で行動したのだと言われるなら、彼らは何をしているのか分かっていないことになります。
私も Fable の発表が急ぎすぎたことは完全に信じられます。証拠としては、火曜日に実施されたこと、Anthropic が出力の downgrade に人々が異議を唱えることを認識していなかったこと、分類器の一般的な状態、そして何よりも迅速に実行されたことが挙げられます。
しかし、それが輸出管理命令を容認する理由には一切なりません。
主流メディアは、「明らかに真実である可能性が高い事柄」について非常に奇妙な言い方をするものです。つまり、「いや、そうかもしれないが、厳密に言えば証明できないし、私たちは真剣なニュース組織だからね」という調子です。
The Economist: アメリカ政府の主な目的は、最先端 AI モデルへの外国からのアクセスを制御することではなかった可能性があります。むしろ、輸出管理を Anthropic を標的にするための便利な手段として利用したようです
はい、これは Anthropic を標的にして、誰でもモデルを削除させるための手段でした。彼らはこの方法が引き起こす波及範囲にはほとんど関心がありませんでした。彼らは完全に承知の上で、これが事実上の完全な削除通知であることを理解していました。政府の主張に対して最大限の善意を持って解釈したとしても、これは真実です。
理論的には、政府があまりにも無知で、これが結果として生じることを認識していなかった可能性もゼロではありませんが、それはさらに悪いことです。なぜそれがより悪いか、わかりますよね?
さて、技術的には NSA はメリーランド州フォート・ミーデから運営されています が、これは Hegesth の主張を評価する上ではカウントされません。ただし、「Claude を広範に使用してイランとの未宣戦の戦争に臨んだ」という一連の話は別問題です。
Pete Hegseth: 3 ヶ月前、@DeptofWar は @AnthropicAI を私たちの建物から永久に追い出しました。
過ぎ去る日ごとに、なぜそれが正しい決断だったかが証明されています。[US Flag]
Timothy B. Lee: Claude の物語はあまりにも強力なので、敵対勢力の手に渡すことができます。また、私たちにとって使用するには危険すぎるのです。ここには本当に天才的な発想があります。
Nat Purser: 管理者が、Anthropic の決定が実際のセキュリティ上の必要性に基づくものであり、不満に駆られた報復ではないと人々に信じさせたいのであれば、高位の役人はこのような投稿をただちにやめるべきです
私は以前 Twitter で、この結論部分のスニペットの初期版を投稿しましたが、驚くほど多くの人々が「Anthropic が CEO を 24 時間 365 日いつでも政府の要請に応じて即座に利用可能にし、疑問を挟むことなく何でも実行し、かつ適切な雰囲気を醸成すべきなのに、それをしなかったのだから自業自得だ」という趣旨の返信を寄せてきました
これらの人々は、私たちが共和国に住んでいると信じているのでしょうか?彼らはそうありたいと願っているのでしょうか。私はその点について疑問に思います。
もし企業が「膝をついて従う儀式」を適切に行わなかった場合、Anthropic が苦しむべきだと考え、アメリカの AI 産業全体、私たちの生産性、世界の地位、そして法の支配を何もないために破壊すべきだと彼らは考えているのでしょうか?また、それは Anthropic のせいであり、アメリカ政府は怒り制御に問題を抱えた NPC(非プレイヤーキャラクター)であり、彼に逆らうとどうなるか知っているだろうと考えているのでしょうか。
私は彼らがそう考えているような気がします。まさに私が感じている雰囲気がそれです。
あなたが何を言っているのかよく考えてみてください。
さらに、「Anthropic は政府が AI を規制すべきだと発言したのだから自業自得だ」と言う人々や、「Anthropic はフロンティアモデルは危険だと発言したのだから自業自得だ」と言う人々の存在があります。これらも同様の雰囲気です
ニヒリストではなく、力こそが正義だと信じていない私たちにとって、この事象の合理的な側面を米国政府側の立場から理解するのは困難です。
Anthropic に対する適切な批判は、「議論が続く中で、その命令がいかに愚かだと思われようとも、指示に従ってモデルを削除すべきだった」という点です。これは妥当な指摘です。
人々が実際にほぼ完全に言っていることは、純粋なニヒリズム、権力への崇拝、部族主義であり、自分がより嫌う相手にもダメージを与える限りは誰にでも危害を加えるという態度、そして「雰囲気」に基づいて、あるいはその雰囲気に乗って反撃する行為です。
少なくとも一つの情報源はすでに調査報告書を確認しており、そこには何の根拠もないと主張しています。
他方からは、報告書が何かを示しているという主張や、それが何を指すのかの説明をしている人物はいません。
ケイティ・ムッソウリス(Luta Security CEO):政府の対応は「調査報告書の内容とは全く釣り合っていないように見える」。
すべての AI モデルは、まさにこの方法で防衛側を支援できる能力を持つ必要があります。そうでなければ、攻撃者に対する防御をスケールさせることはできません。
マリア・クリ:ムッソウリス氏は、研究者たちは通常の防衛担当者が AI に尋ねるような質問を行うことでセキュリティ上の脆弱性を発見できたと述べており、これはまさにモデルが意図した通りです。
Anthropic が Mythos を削除した際、本当に完全に削除したようですね。
The Economist: 元英国情報機関の高官は、諜報機関が再びミソス(Mythos)へのアクセス権を回復する可能性が高いと述べており、交渉はすでに始まっている。民間企業にとってはこれがより困難になるかもしれない。それでもなお、一部の観察者は、最終的にアメリカ政府が譲歩せざるを得ないと信じている。
このプロジェクトがあまりにも愚かな方法で実行されたため、グラスウィング・プロジェクト(Project Glasswing)はミソスから分断されているように見える。他者が同様の能力を獲得する前に時計の針は進んでいる。諜報機関や大企業がこれをどう思っているのか、私は気になる。
「良い」ニュースとして、ミソスはすでにパッチが適用されていない脆弱性を多く発見している可能性があり、それらはクラウディ・オプス 4.8(Claude Opus 4.8)や GPT-5.5 が発見された際にパッチを適用するのに十分な強さを持っているため、防御作業は継続されるべきである。
Axios によると、サイバーリーダーたちは、この動きがサイバーセキュリティに有害であると明確に述べている。なぜなら、誰がどのような方法でアクセスできるかという点において、これは攻撃者よりも防御者を助けるからだ。これと同趣旨の公開書簡 が作成されており、政府に対してフェイル(Fable)へのアクセス権を回復するよう呼びかけている。
Kevin Frazier(Axios 経由):「Adobe、Zoom、Sophos のセキュリティ責任者(CISO)、セキュリティ研究者、経営陣を含む有数のサイバーセキュリティリーダーたちは、トランプ政権に対し、Anthropic の最も高度な AI モデルに対する制限を撤回するよう要請しており、この措置は攻撃者よりもサイバー防衛側により大きな損害を与えるものであると主張しています。」
この書簡では、これは純粋な自滅行為であり、ネット上の被害をもたらすだけで何の役にも立たないものと呼んでいます:
我々の理解によれば、この行動を引き起こした元となる研究における基盤モデルの機能は:
- 人間がプロンプトしたコードの一部がセキュリティ上脆弱かどうかを特定することに注力しています。これは安全なコードを記述することを意図するあらゆるモデルにとって必要な機能であり、攻撃的な能力として見なされるべきではありません。
- この現象は GPT-5.5、Opus、Sonnet、さらには Kimi 2.7 などの中国製モデルでも再現可能です。この前例のない措置に対する正当性として、Fable は他の AI モデルを超えた独自の「能力向上」を提供すると主張されていますが、AI は昨年以降も超人的なレベルでバグの発見や動作するエクスプロイト(exploit)の生成を行ってきました。
- アンソロピック社はこの研究に対応しています。セキュリティ専門家として、私たちの仕事はシステムが完全に安全になるという単純な終着点に至るものではないことを認識しており、このような研究の目的は技術を禁止することではなく、継続的な改善を可能にすることです。
- その結果、この措置は防衛側にとって最良のモデルを奪い、市場の不確実性を生み出し、正当化されるべき実際のリスクも存在しないまま、アメリカの AI におけるリーダーシップを危険にさらしました。
この行動は明らかに「雰囲気による統治」でした。決定要因は、「なんとなく不気味だ」という感覚と「アンソロピック社を許さない」という感情の組み合わせであり、「明確なポリシーと閾値があるからである」という判断ではありません。
それでも、意図自体は善意に基づくものであった可能性があります。
ネイサン・ランバート: ダリオ派とサックス派は非常に異なる言語を話しており、ダリオによる説明が拒絶のように聞こえる可能性があります。
これは、まさに「バイブス・ガバナンス」の領域に私たちを置きます。モデルは政府が許容できると判断した時にリリースされ、それが技術的な評価に基づいているとは考えにくいです。
私の推測では、起きたことは非常に単純だったのでしょう。「ねえ、この脱獄(jailbreak)を直して」と誰かが言い、ダリオは「これは無害で直す必要はない」と答えた。問題は、その要求が「この特定の脱獄を直してほしい」なのか、「すべての脱獄を直してください、お願いします」なのかという点です。
上記は好意的な解釈です。悪意的な解釈も存在します。
Ben Smith: ホワイトハウスの同盟者が、これが技術的な問題ではなく文化戦争の問題であると示唆している程度は驚くべきものだ
Matthew Yglesias: 私は彼らが文化戦争の問題だとさえ示唆しているとまでは言わない。彼らは「金を払え、さもないと」という脅し(shakedown)の問題を示唆しているのだ。
中身は全くなく、単なるギャング政治だ
Taylor Budowich: Anthropic は直面している状況に困惑していると聞いているので、公式見解としての迅速な対応を @k8em0 に任せた。これらの人々は本当に状況を理解していないようだ。
あるいは単に:
Miles Brundage: 「実はダリオは傲慢そうだから、政府権力を濫用するのは問題ない」— 一部の皆さんがまさにそう言っている
Martin Casado 氏が発言して何が起きたかに対抗したことに敬意を表します、そして彼が最終的にその人物をブロックしたとしても、「これはサイバー兵器なので、いかなる Jailbreak(脱獄)も許されない」という彼の初期の立場から説得されて移動した可能性さえあります](https://x.com/martin_casado/status/2065877666616717401)。Anthropic のレトリックがこの状況を難しくしなかったというある程度の主張は、「しかし悪い決定は依然として悪い」という文脈で語られる限りであれば、私は完全に容認します。一方、「私たちが皆損をするとしても Anthropic を非難しよう」という文脈での主張には容認しません。
Anthropic は複数の上級技術スタッフをワシントンへ派遣しています、彼らは今日、この問題を整理しようと努力しており、これはまさにこのような状況で取るべき行動です。
我々はまもなくその結果を学ぶことになります。多くの次のステップが考えられます。
現在、我々はほぼ最悪のライセンス制度の下にあります。それは完全に場当たり的であり、雰囲気に基づき、AI の仕組みを理解していない人々の気まぐれに基づいています。また、彼らが誠実に行動しているとは考える理由もありません。
Dean W. Ball: 誤解しないでください:ミソス(Mythos)以降、米国には AI に対するライセンス制度が存在します。ただしそれは非公式なものであり、国家権力や公的透明性に関する一貫した規則や明確な境界線はありません。コンゴにおけるコバルト採掘の方が、米国の未開拓領域における AI ライセンスよりもはるかに制度化されています。
すべての正式な規制や法律を回避し、その結果として行政命令による規制や法律が生まれるのであれば、それはより悪いことです。それがより悪いことだとご存知ですよね?
実際には原則を持つNeil ChilsonとAdam Thierer は、まさにそれがより悪いことを理解しており、そう述べています。
Neil Chilson と Adam Thierer: これは良くないことです!米国の主要な AI 企業が、数百万人が使用していた製品を、政府の少数の高官による非公開で説明のない懸念に基づいて撤回せざるを得なくなりました。これは FDA(米国食品医薬品局)における官僚主義的なリスクのようなものではありません。むしろ、もし牛乳が昨年の株式市場収益の50% を占めていたとしたら、FDA が突然、説明もなく「全員が牛乳を飲むのをやめろ」と要求するようなものです。
… しかし、アンソロピックの規制戦略に異議を唱える場合であっても、政府介入のこのエスカレーションを祝うべきではありません。これは広範な AI エコシステムにとって悪影響です。輸出管理権限が恣意的かつ説明なく継続して行使されれば、企業は新モデルの開発を遅らせ、一般市民が強力な新ツールを利用する機会を奪われることになります。すべての AI モデルは、それ以前のソフトウェアと同様に、パッチ適用が必要な脆弱性を抱えています。米国政府は、いつ、なぜ落下するかを示すことなく、各研究所の頭上にダモクレスの剣(Sword of Damocles)を掲げておくべきではありません。
… この一件は再び、議会が *必ず* *行動* しなければならない理由を示しています。私たちは、法の支配に基づき、明確な基準と透明性のある手続きを備えた、フロンティアモデルの安全性に関するバランスの取れた法的枠組みを必要としています。このプロセスは民間当局によって主導されるべきであり、軍事産業複合体に乗っ取られてはいけません。政府が最近見られた AI 政策における場当たり的で先見性の欠けたアプローチを継続すれば、アメリカの AI におけるリーダーシップは低下します。
よく言われています。ホワイトハウスが行っていることは、将来の AI 能力や AI リスク、あるいは「AI 競争に勝つ」必要性についてのあなたの見解にかかわらず、ひどいことです。すべてにおいて悪いことですが、唯一の違いは、場当たり的なシャットダウンの脅威を通じて権力がホワイトハウス内に集中している点です。
トランプ氏が提案された大統領令がアメリカの AI に過度な悪影響を与えることを懸念し、署名をしなかった時期を覚えていますか?これはそれよりもずっとはるかに悪い状況であり、さらに多くの問題も抱えています。
R Street のマーク・ダルトンは同様の分析を行っており、これを「フェイブルの惨事:悪いアイデアがさらに悪く適用された」と呼んでいます。ITAR(国際武器取引規則)や KYC(顧客確認手続き)がこの任務に適していない点を指摘し、このように行うことで実際の外交政策上の結果に直面することになると指摘しています。
前回も言及しましたが、繰り返す価値があります:もう一つの問題は、これまで自分たちが私たちの同盟国であり、AI の傘の下にあると考えていた人々に対して大きな打撃を与えることです。
EU にはまだ ASML が残っていることを忘れないでください。
このような状況下では、そのような人々は『アメリカ製 AI スタック』を信頼しないだけでなく、競合するスタックの構築を試みるでしょう。これは彼らを中国の手元に追いやるリスクがあり、自国の制御下にある独自のチップやデータセンターを持つ方向へ、また、それらがはるかに劣っているにもかかわらず非米国のオープンモデルを使用する方向へと向かわせることになります。
タイラー・カウエン:新たな一線が越えられました。米国政府遂に、無制限の使用には危険すぎる AI モデルを宣言しました。これは米国内および世界中の AI の進歩を麻痺させるような動きです。
ここで起こっている出来事は、アメリカのオープンモデルにとっても好ましくない兆候です。もしアメリカが、Fable のように厳重に保護されている場合であっても、モデルの重みだけでなくモデルの出力自体にも輸出規制を課す気があるなら、あなた方のオープンモデルも狙われることはないと思いますか?そこには簡単に除去できる分類器はなく、誰かが obliterator について知っていれば元に戻せる安全訓練もなく、一度リリースされればシャットダウンできない状態です。
今起きていることの含意について、さらに深く考えてみてください。
私たちの政策対応は、驚くほど速いペースで軌道から外れ始めています。
したがって、私はここで法の支配がいかに必要不可欠であるか、そして新しい体制が始まって数週間しか経っていないのにすでにその代替案がどれほど悪化しているかを思い起こさせることで締めくくりたいと思います。
Dean W. Ball: AI 政策は、アメリカの市民教育がいかに深く空洞化されているかを示す非常に痛烈な例です。技術政策のほぼすべての他の分野では、少なくとも参照できる過去の法律や規制が存在します。もしあなたが私と同じように、政治と法が市民の理想を体現するための儀式的実践であると考えるなら、これらの以前の法体系は過去の儀式的芸術のようなものです。それらは私たちに出発点の感覚を与えてくれます。したがって、暗号資産(クリプト)は新しいものですが、金融サービスという非常に古い産業の一部であり、そこには多くの過去の法的・政治的遺産が伴っています。
AI においてはそのようなものは存在しないため、我々の指導者たちが思いつくのは互いに殴り合うことだけだ。「安定したルールを設けて、常にお互いを殴り合わないようにしよう」という衝動は、業界外では誰も口にするものではない。法の支配というものが、我々の政治的な筋肉記憶から欠落しているように見える。
原文を表示
On Friday evening the United States Government has forced Anthropic to take down all access to Fable and Mythos.
It’s been a rough weekend.
Dean W. Ball: One thing about AI regulation being haphazardly imposed on just-released, highly performant models is that in a very real sense, the government just made my world *dumber.* In some impressionistic sense I almost always think this is true of government, but here it is literal.
More details have come to light. There remains some fog of war, but we now have a rather good idea why Claude Fable and Mythos were, deeply stupidly, taken down.
- A narrow jailbreak was discovered, of the type Anthropic warned in advance obviously existed. All demonstrated outputs are things GPT-5.5 can not only produce, but produce without any sort of jailbreak or bypass.
- The White House demanded Anthropic take down Fable to ‘fix’ the situation, and did not listen when Dario tried to explain that there was no situation to fix.
- When Anthropic did not do so, the White House hit them with an export restriction that they knew would force Fable and Mythos down for everyone.
A lot of nihilists are justifying this decision, and blaming Anthropic, all of whom are very much confirming that they adhere to Dean Ball’s portrait of the United States Government as a dying NPC hospice patient we have to properly placate with the proper vibes and genuflection so they don’t lash out at us. Except they equate this with strength and righteousness, because might makes right, power and vibes.
This is a fast developing story with a large speed premium, so I apologize for any errors, and for the structure likely not being ideal. We do the best we can.
What we do not know is:
- What was motivating the government to make these decisions.
- How deeply they were confused about how any of this works.
- Whether they demanded and are demanding a narrow fix or a global fix.Narrow fix is probably easy. Global fix is probably impossible.
- What they intend to do next and what they are trying to accomplish.
The good outcome would be that this is a terrible misunderstanding, a reflection of a panic reaction, which can be sorted out quickly, after which we can restore access. Or where they otherwise face enough pressure they quickly realize they made a mistake, or Anthropic can do something to quickly assuage their concerns even if it is dumb. There will still be a terrible precedent set, which comes with a lot of permanent damage to trust in American AI, to our business climate, to our ability to employ vital foreign AI talent, to America’s relationships to its allies, to the progress of Project Glasswing and our cyber security, and to the rule of law.
The silver lining, which might be large, is that this will have shown that when we actually need to act, we are not afraid to act, even at great economic and political cost. Sometimes there will be a demand driven by national security, or other concerns, and if you cannot physically meet that demand without shutting down? Tough. This was (with notably extremely rare exceptions) an action far out of bounds of what safety advocates have dared propose as even an option, and it happened. So there’s no more saying, in such situations: ‘Give up, the government will never do [X].’
This also emphasizes the need to figure out how to act well, now, before we need to act. If we get into such a situation, and don’t have a good way to do [X], we might well do [X] in a no good, haphazard, deeply destructive way, instead. So get to work figuring out how to strike deals, or do a pause, or take down a given model, and so on.
The bad outcome is if this is not a terrible misunderstanding, is motivated by other factors, and cannot be sorted out quickly. The government might actually be rapidly escalating towards a forcible takeover of America’s leading AI labs by a would-be authoritarian unitary executive that thinks you should never talk back to it, and when it says jump (or asks for stock, or anything else) everyone should ask how high. Or else.
There is also the third possibility that, as unlikely as it looks now, the White House was correct, the threat was real, and this was an emergency situation, whether or not they did a good job justifying this to Dario and Anthropic in real time, and whether or not they are doing a good job justifying this now. Perhaps this was itself dangerous, or perhaps it implied too high risk of other dangers.
We cannot rule this out until we can verify technical claims. And we should not assume that next time, the company will be right and the government wrong. There likely will come a time when a company says ‘This Is Fine’ and is very, very wrong.
If that proves to be true, Anthropic will have lost a ton of credibility on all fronts, which is another reason I find this so unlikely. They cannot afford to be wrong, here.
- What Happened When: The Bottom Line.
- Amazon Calls The White House.
- The Government Panics.
- The Stupider Version.
- There Was No Wellness Retreat.
- Make Your Threats Explicit.
- Was China Accessing Mythos?
- Should Anthropic Still Have Taken Fable Offline When Asked?
- Yes, This Was A Takedown Order For Fable.
- We Are Not Saying The DoW Fight Is Related And Yet.
- The Nihilists.
- Mostly Harmless.
- Everyone Means Everyone.
- This Could Be The Good Scenario And Mostly A Misunderstanding.
- The Next Step.
- The Worst Licensing Regime Is Fully Ad-Hoc.
- We Are Showing We Are Unreliable Partners.
The government’s own account is that Anthropic’s ‘lack of seriousness’ around responding led to the government imposing export controls.
If we believe Axios and Politico, the ‘lack of seriousness’ was when Anthropic:
- Did not rush to take down Fable and act super deferential and serious.
- In response to a jailbreak that did not do anything GPT-5.5 cannot do.
- With no details provided.
- And instead asked for details of the incident.
- Within 90 minutes, on Friday afternoon.
So it was basically ‘Anthropic wants to only do things because of reasons, and thus we concluded the vibes were off, so f*** them we’re blowing it all up to show who is boss.’
This is also the second time ‘we could not reach Dario this particular minute so we had to blow up all of American AI policy shortly after 5pm on a Friday’ has come up as an excuse. It was also used by Emil Michael.
This time, the claim is that he was at a ‘wellness retreat’ which Anthropic categorically denies, and which Ashlee Vance, who was there, categorically denies.
Anthropic says it made Dario available 75 minutes after he was requested, and that other senior Anthropic people were made available during that time. I believe them.
The White House waited far longer than 75 minutes, indeed they waited overnight, after they were contacted by Amazon, to start attempting to contact Dario.
Details continue to come in on the events and the timeline. First Axios:
Maria Curi (Axios):Behind the scenes: Amazon called administration officials Thursday night to share a report showing how they were able to jailbreak and access portions of Anthropic’s powerful new Mythos model that pose a national security threat, sources familiar told Axios.Anthropic had previously notified the government multiple times about the planned June 9 release of Fable — which is a general-use version of Mythos —and the government did not object, a source close to the company said.But calls from Amazon — as well as at least five other companies to a variety of senior administration officials Thursday evening and Friday morning — led to the model being shut down by Friday night.
Amazon is confirmed as the central call, among others, that caused the White House to start taking actions that led to them taking down Fable.
As I discussed last time, Anthropic’s release announcement included clear warnings that jailbreaks on the level of what Amazon did were possible. I have no doubt they extensively briefed the administration on such details.
Does anyone remember this graph, from the Fable 5 release announcement?
I do not understand why Amazon’s CEO called the White House over this. There is a key piece of information there that we do not know.
Anthropic was then given less than 24 hours from the initial call by Amazon, and no details of anything actually concerning happening, after which it was hit by a classic ‘Friday after 5pm’ order. For most of those less than 24 hours, the government had not yet attempted to contact Anthropic about this.
We have a source in the White House confirming, even if we fully buy their story, that they decided to risk blowing up all of American AI because they did not like the vibes they got in 90 minutes over a series of phone calls.
Sophia C and Cheyenne Haslett: The move, which followed multiple tense calls between Anthropic CEO Dario Amodei and administration officials, including Treasury Secretary Scott Bessent and White House Cyber Director Sean Cairncross, underscores how the White House is wrestling in real-time with regulating fast-moving and potentially dangerous AI models.… Following the meeting, the administration attempted to reach Amodei but was told he was unavailable because he was attending a wellness retreat, one of the administration officials and the senior White House official said.A spokesperson for Anthropic rejected the claim that he was at a wellness retreat, saying, “this is absolutely false.”A person close to Anthropic said Amodei was first requested around noon and was on the phone with senior officials within an hour and 15 minutes. While he was out of pocket, Anthropic offered other senior leaders in his place, the person said.When the administration finally reached Amodei, he participated in three calls with a combination of roughly half a dozen senior administration officials, including Cairncross, Bessent and Commerce Secretary Howard Lutnick, according to the senior White House official and one of the administration officials.… During the calls, Amodei tried to clear up what he assumed was a misunderstanding. He pushed back on the administration’s concerns, defended the guardrails and argued that the type of bypass that occurred, which he believed to be specific, did not pose the same risk as a broader “jailbreak” that would allow it to be used without any of the guardrails put in place by Anthropic.
Dario tried to explain that this was a narrow issue, and they simply did not understand or believe him, or chose not to understand or believe him.
We now know that Dario was fully correct that the issue was narrow and harmless.
Where Dario was incorrect was in assuming those he was talking to were both capable of and interested in understanding what he was trying to say.
They urged Anthropic to voluntarily remove the model and coordinate with the government to address the vulnerabilities, according to the senior White House official and the two administration officials. Amodei asked for more time and information, but he made no commitments to pull the model, and at one point Bessent told Amodei directly that he was making a “bad decision,” according to the senior White House official.… “Export controls were a last resort after begging them for hours to work with us,” the senior White House official said. “This was not something we wanted to do, but our hands were tied.”After publication, one of the people close to Anthropic disputed that the company was given a choice to voluntarily work with the administration. “The White House gave 90 minutes to take the models down, with no details on the actual threat,” the person said. “There was never any begging — or asking — for them to work with us, just a declared 90 minute deadline.”tae kim: FT confirms: "Anthropic was given 90 minutes to comply and was not provided with detailed concerns before the order was issued, according to a person close to the company."
Do you think the White House was ‘begging for hours?’ Or do you think they’re just throwing words out, that at best are code for ‘we did not issue an official order yet?’
I see no reason not to believe Anthropic here. Dario tried to explain that this was a false positive and asked for details. The White House did not provide any details that supported their claims, or evidence that this was necessary or prudent. They simply said ‘remove Fable in 90 minutes,’ likely without making it clear this was ‘or else IFAR.’
What pissed them off, it seems, is in large part that Anthropic wanted reasons, rather than asking how high when told to jump.
That he failed to commit to asking how high, in general, no matter what.
Axios: The bottom line: The source familiar with the government’s thinking said there was a “lack of seriousness” that Anthropic was applying to the release of Fable. “Had Anthropic taken it seriously and, rather than dismissing as isolated, moved to fix or pause access, this would have never happened,” the source said, adding “they were overly confident.”
As in, they told us we were wrong. That means they are not serious. How could they possibly understand the situation better than the Treasury Secretary?
Catch up quick: At 1 p.m. ET on Friday, Anthropic received a call from the government instructing them to roll back the release of the Mythos and Fable models due to a “national security threat,” but with no further details, the Anthropic source said.“We immediately sought to understand the specific nature of the threat so we could remediate it,” the source said, but the government held firm on the demand.Anthropic source: The Trump administration gave Anthropic 90 minutes on Friday to pull down its most powerful models before imposing a licensing regime on the company, according to an Anthropic source.Miles Brundage: Sure sounds like a hit job.
And that’s the good version. The bad version, as Chubby explains here, and which Axios seems to make clear, is that the White House is simply being petty, and thinks Anthropic ‘screwed them’ by asking for reasons and by having employed people with opposing political views. That is very illustrative of how these people think.
Why it matters: Governing the world's most consequential technology is coming down to speaking President Trump's language.Anthropic failed to "honor" a recent cyber executive order, administration officials claim, and the company's purported failure to take the matter seriously led to its most powerful products being scrubbed from the internet."Everybody said Anthropic was a bad actor. Some of us said it was time to give them a chance. Now those people are questioning that. They screwed us," an administration official said.…Behind the scenes: "Anthropic has not done a great job at trying to speak to the administration and appreciate the ideological differences," one source familiar with the administration's thinking said. "It's like they just speak in different languages," the source said, adding that the company has simply not figured out how to communicate with this administration.…Even before this breakdown, a previous fight between Anthropic and the Pentagon also came down in some ways to just not liking the person on the other side of the negotiating table. A White House official told Axios that the Pentagon fight is completely unrelated — but Anthropic's inability to communicate effectively showed up in a similar, unhelpful way."We never wanted this to happen. Our number one priority is innovation but our hands were tied," the White House official said. The optics added fuel to the fire. Anthropic came out with a blog post dismissing the Amazon report. Then the company enlisted a cybersecurity expert viewed by the administration as a "radical Democrat," who was then celebrated by Chris Krebs, who Trump just fired.
The White House did not like that the Anthropic security expert was a ‘radical Democrat’ and the White House is interpreting that as ‘they screwed us’ and should now be considered bad actors.
The stupidity, on all sides, of such a thing, knows no bounds. This is not something that should matter, but it also would be a really stupid mistake by Anthropic. Look, yes, these folks are that obsessed with political perspectives, so when dealing with them directly you really do need to prioritize sending in people who won’t set off these folks, even though this is a fully apolitical situation where that concern makes no sense. So it’s kind of on everyone.
Ashlee Vance: Anthropic has pushed AI forward dramatically over the past two years. It’s currently the crown jewel of US AI tech.The Feds don’t like @DarioAmodei because he won’t do all their bidding. And so, we’ve now entering the Soviet-style propaganda portion of the program with the White House feeding every reporter it can find with laughable claims like Dario is unreachable at a wellness retreat. Come on.I’d hoped the US would not be self-defeating on AI, since it’s kinda one of the last hopes the US has versus China. But here we are . . . . alreadyNone of this was some weeks long back and forth. I was at Anthropic’s HQ on Friday reporting when this all unfolded. Dario is not at a wellness retreat. The Feds seemed to be scrambling to try and make an example of Anthropic again. This is not technical. It’s petty.Think Anthropic was just trying to figure what was at the heart of the gripe and was not given much time to do so. Not sure if you’ve noticed but this is isn’t always the most rational and good faith of administrations.Teortaxes: I condemn libel“Dario was at wellness retreat” is almost certainly stereotype-driven bullshit cooked up by cruel baboons like Hegseth. Dario is a fanatic and a founder CEO, not a hippie, and he wouldn’t go on a vacation while the obviously tense situation with Fable unfolds.
I find it very unlikely that Dario was at a wellness retreat, but even if he was you do not blow up all of American AI policy if a CEO does not have his phone for four hours and left someone else in charge. What is this, 2029?
There has been a lot of miscommunication between the White House and Anthropic.
Reporting is that Dario Amodei was told ‘you are making a bad decision’ when he refused to voluntarily take down Fable, instead asking for more information.
The thing is, that could mean anything. It could mean ‘we will be mad at you’ or ‘this is now on you and if something goes wrong it is your fault.’
Could all of this have been avoided if instead of maintaining deniability, Dario had been told, explicitly, ‘Fable is going offline today. If you do not agree this minute to do this voluntarily we will hit you with an export control and you’ll be totally f***ed?’
I don’t know. But my guess is yes.
I did notice that the option had previously been put on the table, here’s Axios:
The administration first threatened Anthropic with export controls a couple of weeks ago after learning that its cutting-edge Mythos model was made available to an entity in a foreign country with direct ties to the Chinese Communist Party, according to the White House.
There is the claim via the Financial Times, Verge and Semafor that the White House learned that ‘a China linked-group’ had accessed Mythos. My suspicion is this is a mixup with the earlier incident mentioned just above? Could go either way.
That is absolutely going to happen, at least from time to time, when there are over 100 partnerships given access to Mythos. Access controls can only go so far. The key is to contain what can be done before the compromised access is discovered and closed. The report said ‘had been accessed’ rather than ‘has continued access.’
It would be non-crazy, although likely an overreaction, to ask that this mean Mythos be temporarily limited to a core group within Glasswing, or potentially even shut down entirely for a time, but that would not impact Fable.
It could potentially also have contributed to the vibes issues, or there could have been confusion about the relationship between these two things.
Look. Yes. A mistake was made. I am not a ‘oh Anthropic did nothing wrong’ guy here.
Try to talk them out of it if you can, but when they aren’t budging, you do it, even though it is mind bogglingly stupid and expensive and might be kind of a hit job.
And I do think they bear some of the responsibility here, because of that, and also they could have in various ways ‘handled’ the White House better, including in terms of who they sent in.
You want to establish, on multiple levels, the precedent that you take the model down when told to while you sort things out, and you say you were doing it because the government raised a potential security concern, at least until such time as it is clear they are not going to get over it any time soon.
In hindsight this is even more obvious. But what is done is done.
And I get it. The request was unjustified and nonsensical and rushed and the people had no idea what they’re talking about, and they really are just ordering you to do their bidding like this isn’t a Republic and that is not okay, and no one would be so stupid as to… yeah. Yeah.
There are also various signs that the Fable launch may have been somewhat rushed.
Miles Brundage: The admin is going to keep leaking all sorts of details that make it sound, to a casual reader, like this was a reasonable decision.But there has been zero indicating that domain experts at CAISI or NSA were involved - all reporting points to “senior White House officials.”The closest that there has been to such an indication is the claim that the jailbreak research was shared with “security researchers.”But there is no indication that this had influence on decision-making + the 1 independent researcher who has been quoted concurs with AnthropicTo be clear, I think it’s quite plausible to imagine a reasonable case that “the Fable launch was rushed.” Threat modeling, cost-benefit analysis, etc. are hard.Less likely is a good case that “this was clearly bad *and* also 5.5 was (and soon 5.6 will be) clearly good.”Nathan Lambert: +1, vibes
If you tell me the head of CAISI consulted his team and thinks Fable access needs to be restricted and the threat is serious, I would be a lot more likely to believe it. If you tell me it was Commerce acting alone, they don’t know what they are doing.
I also totally can believe that the Fable release was rushed. Evidence includes it happening on a Tuesday, Anthropic not realizing people would object to the output downgrading and the general state of the classifiers, and it just happening fast.
That does not in any way make the export control order okay.
Mainstream media has this very strange way of saying that the obviously true thing might actually be true, ya’al, but strictly speaking we can’t prove it and we are a Serious News Organization.
The Economist: The American government’s primary aim may not have been to control foreign access to frontier AI models. Instead, it appears to have used export controls as a convenient way to target Anthropic
Yes. This was a way to target Anthropic to get them to take the model down for everyone, and they did not much care about the blast radius of the method. They knew full well that this was a de facto full takedown notice. That is true even if you are maximally charitable to the government’s case.
It is in theory possible they were so clueless they did not realize this would be the result, but that’s worse, you know why that’s worse, right?
Well, technically the NSA operates out of Fort Meade, Maryland, so that does not count here in terms of evaluating Hegesth’s claims, although there is the whole ‘they used Claude extensively to fight an undeclared war against Iran.’
Pete Hegseth: Three months ago, @DeptofWar kicked @AnthropicAI out of our building—forever.Every passing day proves why that was the right move. [US Flag]Timothy B. Lee: Claude Fable is so powerful we can let it fall into the hands of our adversaries. Also it’s too dangerous for us to use it. Real galaxy-brain stuff here.Nat Purser: if the admin wants people to believe the anthropic decision was made out of genuine security necessity rather than grievance-driven retaliation, high ranking officials could simply stop posting like this
I posted an early version of the bottom line snippet from earlier on Twitter and a remarkable number of people replied with a version of ‘how dare Anthropic not make their CEO available 24/7 on a moment’s notice and do whatever the government asks them to do without question while sending the correct vibes, they didn’t do that so this serves them right.’
Do these people think we live in a republic? Would they like to? I wonder.
Do these people think that if a company doesn’t perform the Shibboleths of knee bending properly then we should wreck American AI, all of our productivity, our global position and the rule of law over nothing, cause Anthropic deserves to suffer, and that is Anthropic’s fault because America’s government is an NPC with an anger management problem and you know how he gets when you talk back to him?
I think they kind of do. That is exactly the vibe I am getting.
Think about what you are saying.
That’s on top of the people saying ‘Anthropic said government should regulate AI so this serves them right’ or ‘Anthropic said that frontier models are dangerous so this serves them right.’ Similar vibes.
Whereas for those of us who are not nihilists, who do not believe in might makes right, it is hard to see the reasonable version of this from the USGov side.
The correct criticism of Anthropic is ‘they should have still taken the model down when ordered, no matter how stupid they thought that was, while discussions continued.’ That’s valid.
The things people are almost entirely actually saying? It’s a bunch of nihilism, of pure worshipping of power and tribalism, and hurting everyone as long as it hurts those you dislike more, of lashing out because of and with vibes.
At least one source has now seen the research report, claiming it shows nothing.
We don’t have any person on the other side claiming that the report shows something, or explaining what that something might be.
Katie Moussouris (CEO Luta Security): The government’s response “seems way out of line with what’s actually in the research report.”All AI models need to be able to help defenders in exactly this way, or we won’t be able to scale our defense against attackers.Maria Curi: Moussouris said the researchers were able to find security vulnerabilities by asking questions normal defenders would ask AI, which is exactly what the model was intended to do.
It looks like when Anthropic took Mythos down, they really did fully take it down.
The Economist: Spy agencies are likely to regain access to Mythos, says one former British intelligence official; negotiations are already under way. Private firms may find it harder. Even so, some observers believe the American government will eventually have to relent.
It appears that, because this was done in such a stupid fashion, Project Glasswing is cut off from Mythos. The clock is ticking before others get similar capabilities. I wonder what the spy agencies and major corporations think about this.
The ‘good’ news is that Mythos has presumably already found a lot more vulnerabilities that remain unpatched, and which Claude Opus 4.8 and GPT-5.5 are strong enough to help patch once they are found, so defensive work should continue.
Cyber leaders, according to Axios, are being clear that this move net harms our cyber security, because given who has access in what ways it helps defenders more than attackers. There is now an open letter to this effect, urging the government to restore access to Fable.
Kevin Frazier (via Axios): “Prominent cybersecurity leaders — including CISOs, security researchers and executives at Adobe, Zoom and Sophos — are urging the Trump administration to reverse restrictions on Anthropic's most advanced AI models, arguing the move hurts cyber defenders more than attackers.”
From the letter, calling this a pure unforced error that does nothing but net damage:
It is our understanding that underlying model capabilities in the original research that triggered this action:Were focused on determining whether a human-prompted section of code was insecure. This is a necessary capability in any model that is intended to write secure code and should not be considered an offensive capability.Can be replicated on GPT-5.5, Opus, Sonnet and even Chinese models like Kimi 2.7. The justification for this unprecedented action was that Fable provides a unique “uplift” of capabilities beyond other AI models, but AI has been finding bugs and generating working exploits at superhuman levels since last year.Anthropic is addressing the research. As security professionals, we recognize that our work does not lead to a simple end-state where a system is fully safe, and the purpose of research like this is to enable continuous improvement, not to ban the technology.As a result, this action has taken the best models away from defenders, created market uncertainty, and risked America’s AI leadership without any real risk to justify it.
The action was definitely ‘vibe governing.’ The decision was some combination of ‘this seems vaguely spooky’ and ‘f*** Anthropic,’ not ‘we have a policy and a threshold.’
It could still be well intentioned.
Nathan Lambert: The Dario faction and the Sacks faction speak very different languages, and a Dario clarification could sound like a refusal.This puts us very squarely in vibe governance. Models are released when the gov thinks its okay, and it is unlikely this is based on technical evals.
My presumption is that what happened was pretty straightforward. Someone said ‘hey there is a jailbreak fix it’ and Dario said ‘this is harmless there is nothing to fix.’ The question remains, was the request ‘fix this particular jailbreak’ or ‘fix all jailbreaks pls tks?’
The above is the charitable interpretation. There is also the uncharitable one.
Ben Smith: Extent to which White House allies are signaling that this is a culture war issue, not a technical one, is strikingMatthew Yglesias: I would say they’re not even signaling that it’s a culture war issue, they’re signaling that it’s a “pay us money or else” shakedown issue.There’s no content at all to this, it’s just gangster politicsTaylor Budowich: I’m told Anthropic is perplexed by the situation they are facing, so they’ve turned to @k8em0 to do their on-the-record rapid response. These people really just don’t get it.
Or simply:
Miles Brundage: “Well acktually Dario seems smug so abusing government authorities is fine” - some of y’all basically
Kudos to Martin Casado for speaking out against what happened, and maybe even being convinced by argument to move from his initial position of ‘it’s a cyber weapon so any jailbreak is unacceptable’ even if he did end up blocking that guy. I will fully allow some amount of ‘Anthropic’s rhetoric did not make this easier’ if it is coupled with ‘and bad decisions are still bad’ rather than ‘so f*** Anthropic even if we all lose.’
Anthropic is flying various senior technical staff to Washington, who are spending today trying to sort this all out, which is absolutely what you do in this situation.
We will soon learn how that goes. Many next steps are possible.
We now have more or less the worst possible licensing regime. It is fully ad-hoc, vibes based, and based on the whims of people who do not understand how AI works, and who we have no reason to assume are acting in good faith.
Dean W. Ball: Make no mistake: post-Mythos, the United States has a licensing regime for AI. It’s just informal, with no consistent rules or firm boundaries on state power or public transparency. Cobalt mining in the Congo is vastly more institutionalized than frontier AI licensing in the US.
If you avoid all formal regulations and laws, and this results in regulation and law via executive fiat, that’s worse. You know that that’s worse right?
Neil Chilson and Adam Thierer: This is not good! A leading U.S. AI company was forced to take down a product that millions were using based on non-public, unexplained concerns of a few government officials. This isn’t the red-tape risk of the FDA. It’s more like the FDA demanding, out of the blue and without explanation, that everyone stop drinking milk — if milk was 50% of last year’s stock market gains.… But even if you disagree with Anthropic’s regulatory strategy, this escalation of government intervention is nothing to celebrate. It is horrible for the broader AI ecosystem. Continued arbitrary, unexplained deployment of export control authority will make companies slow-walk new models, depriving the public of powerful new tools. Every AI model, like all software before it, will have vulnerabilities that require patching. The US government should not hang a Sword of Damocles over every lab’s head, with no indication when it might drop or why.… This episode yet again shows why Congress must act. We need a balanced statutory framework for frontier model safety, rooted in the rule of law, with clear standards and transparent procedures. Civilian authorities must direct this process; it must not be co-opted by the military-industrial complex. America’s AI leadership will diminish if our government continues the ad-hoc and myopic approach to AI policy recently on display.
Well said. What the White House is doing is terrible no matter your view on future AI capabilities, or AI risks, or the need to ‘win the AI race.’ It is bad all around, except that it centralizes power within the White House, via the threat of ad hoc shutdowns.
Remember when Trump was worried that a proposed Executive Order would harm American AI too much, so he did not sign it? This is so, so much worse for that, while also having many other problems.
Mark Dalton at R Street has a similar analysis, calling this The Fable Fiasco: A Bad Idea Applied Badly, pointing out that ITAR and KYC are not equipped for this task, and pointing out we will face real foreign-policy consequences for doing it this way.
As mentioned last time, but it bears repeating: One of those other problems is that this gives a huge kick to those who previously thought they were our allies and would be under our AI umbrella.
Do not forget that the European Union still has ASML.
Not only will such folks not trust the ‘American AI stack’ under these conditions, they will try to build a rival one. This risks driving them into the hands of China, and towards having their own chips and their own data centers under their own control, and towards use of non-American open models even though they are much worse.
Tyler Cowen: A new line has been crossed: The U.S. government has finally declared an AI model too dangerous for unrestricted use. It’s the kind of move that could cripple AI progress in the U.S. and around the world.
The events here also do not bode well for American open models. If America is willing to put export controls on not only model weights but the model outputs, even when they are as heavily safeguarded as Fable, do you think they are not coming for your open models, with no classifiers that are not easily removed, with no safety training that cannot be undone by anyone who knows about obliteratus, that cannot be shut down once released?
Think harder about the implications of what is happening.
Our policy responses are going off the rails remarkably fast.
So I will close with a reminder of how badly we need rule of law, here, and how bad the alternative is already proving to be only weeks into the new regime.
Dean W. Ball: AI policy is a really poignant example of just how deeply American civics have been hollowed out. In almost all other areas of tech policy, we have at least some prior law and regulation from which to draw. If you think, as I do, that politics and law are ritual practices through which we embody civic ideals, these earlier bodies of law are like prior ritual art. They give us some sense of a starting point. So even though crypto is new, it is part of a very old industry (financial services), which carries with it a lot of prior legal and political art.
With AI we have nothing of the sort, so all our leaders can think to do is punch one another. The impulse of “let’s have stable rules so that we aren’t punching one another all the time” isn’t really something you hear anyone saying outside of industry. The rule of law seems absent in our political muscle memory.
関連記事
米国政府が Anthropic の Fable および Mythos アクセスを強制停止
米国政府は金曜日夜、高性能 AI モデル「Fable」および「Mythos」へのアクセスを Anthropic に強制停止させた。規制の無秩序な適用により、AI 開発者の世界が劣化すると指摘されている。
米政府によるアンソロピック禁止が、かえってブランドを助けているのか?
米国政府は国家安全保障上の懸念から、アンソロピックに対し最新モデル「Fable 5」と「Mythos 5」の撤回を命じた。サイバーセキュリティ研究者らはこの措置を危険と指摘し、同社も他のモデルにも同様の抜け道が存在すると認めている。
Amazon のセキュリティ研究がホワイトハウスの Anthropic Fable 禁止に繋がったと報じられる
ウォール・ストリート・ジャーナルの報道によると、アンソロピックが Fable 5 と Mythos 5 へのアクセスを停止させた輸出管理指令は、アマゾンのサイバーセキュリティ研究とアンディ・ジャシー CEO のホワイトハウスとの協議が引き金となった。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み