トランプ大統領が先端的モデルリリース前に AI テストを義務付ける行政命令に署名
トランプ大統領がAI規制の執行命令への懸念を撤回し、 Frontier モデルリリース前のテスト要件を含む新しい行政命令に署名したことで、業界における規制の不可避性が確定した。
キーポイント
規制方針の劇的転換
トランプ大統領が当初「過度な負担」として執行命令の撤回を検討していたが、最終的に変更を加えて署名し、規制への姿勢を明確に転換させた。
業界からの圧力と合意形成
デイビッド・サックスやイーロン・マスクらによる「何もしない」派のロビー活動が一時的に成功したかに見えたが、連邦政府による独立監査や安全基準の必要性への世論が高まり、規制は不可避となった。
具体的な規制要件の提示
代表ローリ・トラハンらが提案する通り、大規模AI企業に対する第三者監査の義務化、内部告発者の保護、および労働市場への影響に関するリアルタイム報告が求められている。
労働者保護と雇用対策
AIによる雇用の喪失に対し、事後の訓練ではなく、労働市場の変化を先取りする政策が必要であり、雇用主にはAIが解雇理由であることを明記する義務が提案されている。
AI による大規模解雇の通知義務化
労働者が AI の導入により解雇される場合、雇用主は WARN Act の要件に基づきその理由を明記するよう義務付けられる。
連邦政府による規制の必要性と先例法理
国境を越えた商用取引や国家安全保障に関わる最先端 AI 技術の開発は、州政府ではなく連邦政府が主導し、州法を優先するべきである。
新執行令状の主要な内容
同令状は「イノベーション」を掲げつつ、サイバー防御の強化(第 2 条)、AI 利用型サイバー犯罪への対応(第 4 条)および最先端モデル開発の安全確保(第 3 条)を定めている。
影響分析・編集コメントを表示
影響分析
このニュースは、AI業界における「自己規制」や「不作為」の時代が終わり、法的拘束力のある厳格な監査制度と安全基準への移行が始まることを示唆しています。特に Frontier モデルの開発企業にとっては、コスト増と開発プロセスの変更を余儀なくされる可能性が高く、業界全体の競争環境とイノベーションの速度に大きな影響を与えるでしょう。
編集コメント
トランプ大統領の態度転換は、業界ロビーの努力が政治的圧力に屈した象徴的な出来事であり、今後は「安全監査」の実施が事実上の必須条件となるでしょう。企業側は即座に対応策を講じないと、市場参入自体が困難になる可能性があります。
先週、私たちは木曜日に行政命令が出ると予想していました。
その後、トランプはそれをキャンセルし、負担が大きすぎることを懸念して署名しないと述べました。
しかし、1 つの変更を加えた上で、彼は火曜日に結局署名しました。
オーバートン・ウィンドウ(議論可能な政策の範囲)がシフトしました。何もしないことはもはや現実的な選択肢ではなくなりました。

以前は死んでいた行政命令
数日間にわたり、デイビッド・サックス氏やエロン・マスク氏らと共に、行政命令を廃止するようロビー活動に成功したと考えていました。「何もしない」派が勝利したように見えました。世間の噂では、この命令は実質的に死んだ状態でした。
ディーン・ボール氏とダニエル・ココタージョ氏は、行政命令が死んでいると見て、同命令に含まれる特定の規制体制(regime)は何もしない場合よりも悪くなる可能性が高いと同意しました。これは、その内容に多くの意図的な検討が加えられていなかったことを考えれば、妥当な見方です。
しかし、何もしないことは明らかに不十分でした。
私たちは現在、そして今後ますます、AI を規制するための行動を求める声に直面しています。
ローリ・トラハン下院議員:世界で最も強力な AI システムがどのように構築され、テストされ、展開されるかを規律する連邦法は存在しません。その安全性主張を検証する独立した監査人もいません。何か問題が生じた際に介入する明確な権限を持つ連邦機関もありません。
AI に関する対応は、今すぐ議会が行わなければなりません。
ローリ・トラハン下院議員:第一に、最先端における真の責任の明確化です。最大の AI 企業には、安全およびセキュリティの枠組みを公表し、これに従うことが義務付けられるべきです。また、その取り組みを示すために第三者による監査に応じる必要があり、連邦および州の規制当局は、技術が進展するにつれてこれらの要件を執行・更新する権限を与えられるべきです。最も強力な研究機関には、不正行為を暴露したい内部告発者を沈黙させることを許してはいけません。私たちの未来を再構築しうるモデルを開発している企業は、信頼に頼るだけの運用をしていてはなりません。
第二に、安全慣行の独立した検証です。連邦政府がすべての AI モデル自体を検証することはできず、またそうすべきでもありません。むしろ、民間組織を認定して最先端の研究機関に常駐させ、その安全慣行を評価し、企業が不十分となった際に連邦および州の執行機関を招集できるようにするべきです。これらの組織は機敏で透明性があり、技術のスピードに合わせて構築されると同時に、プレスリリースで行われた安全へのコミットメントが実際に守られているかどうかについて、議会、規制当局、そして一般市民が把握できるものでなければなりません。
第三に、アメリカの労働者を保護することです。ヘイバーヒルからの教訓は、事後の職業訓練では政策にならないということです。労働者が必要としているのは、AI が労働市場をどのように再構築しているかというリアルタイムの状況把握であり、これにより議会は混乱に対して数年遅れて対応するのではなく、先手を打つことができるようになります。
AI が労働者に解雇の通告(ピンクスリップ)をもたらす理由となる場合、雇用主はそれを明らかにすべきです。WARN 法(Worker Adjustment and Retraining Notification Act:労働者調整・再訓練通知法)の要件を更新し、AI が大量解雇を引き起こした際に開示を義務付けることで、ブルックスブラザーズが行ったような決定が真空状態で行われたかのようにふりをするのをやめなければなりません。この経済を築いた労働者が次の経済を主導するに値するという信念に基づいた枠組みが必要です。
最後に、サイバー防衛力を強化しましょう。
Dean W. Ball(ツイートへのみの回答、「議会は今すぐ行動すべき」まで):トラハン議員は正しいです。汎用技術と同様に、「AI 政策」も最終的には政府の各層にまたがって共有されることになります。例えば、都市部ではロボットタクシーのライセンス発行が可能です。しかし、フロンティアモデル(最先端モデル)の開発は明らかに州を跨ぐ商業活動であり、先行的な連邦法の制定に値します。
私は、この基本的な点を理解できない人がどうして存在し得るのか、本当に理解できません。「極めて高価で生産が困難かつ世界的に分布する新興技術の開発に伴う国家安全保障および公共の安全上のリスク」が連邦政府の責任ではないとすれば、一体何が連邦政府の責任なのでしょうか。連邦政府が政策分野(特に国家安全保障に関わるもの)における管轄権を主張する場合、混乱を避け、その問題に対する直接的な責任を明確にするために、通常は州法を先行的に排除します。これは複雑なことではありません。
先行的排除に全面的に反対する人々は、建国時にアメリカを国家連合(EU 型連邦)ではなく州の連合体とすべきだと主張した反連邦主義者を思い出させます。
テッド・クルーズさえも今やこの動きに加わっています。これは行政命令に署名された後のことです:
テッド・クルーズ上院議員(共和党・テキサス州): AI は急速に発展しています。この政権が先進的なモデルが引き起こすサイバーセキュリティリスクを認識したことは正しいです。
次は議会の番です。中国に譲歩することも、米国人の自由な表現を制限することなく、壊滅的なリスクに対処しなければなりません。
行政命令の復活
その後、ホワイトハウスがついに行政命令を発令しました。戻ってきました。
ブラッド・スミス(マイクロソフト社長): この行政命令は、アメリカ国民のセキュリティを守りながらイノベーションを推進するための重要な一歩です。我々は政権によるこの取り組みを歓迎します。
Anthropic: この行政命令は、AI における米国のリーダーシップを強化する上で重要な一歩です。その実施を支援するためホワイトハウスと協力することを楽しみにしています。
私が目にした企業からの声明はこの2つだけでした。
行政命令は何をするのか
行政命令は、タイトルと目的においてイノベーションについて語り始めています。なぜなら、多くの推進派の人々が「雰囲気」に深く関心を持っているからです。
第2条では、より強力なサイバー防御の実装に対する迅速なタイムラインを定めています。この部分は明らかに善であり、深刻な異議は出ないでしょう。
第4条では司法長官が AI を活用したサイバー犯罪に対処し、第5条は免責事項、第1条は「雰囲気」です。承知しました。
第3条、これが最大の項目で、「Secure Frontier Model Development(安全なフロンティアモデル開発)」と呼ばれています。
これは、各機関の長に対し、2 ヶ月以内に以下の点について調整を行うよう求めています。
サイバー能力に関する機密ベンチマークプロセスにより、「対象となるフロンティアモデル」が何であるかを決定すること。
ラボがベンチマークを受けられるようにする自主的な枠組みであり、政府に対して他者の信頼できるパートナーへの公開前に「最大 30 日間」、機密かつ安全なモデルアクセスを提供すること。
絶対に、いかなる形でも、必須の政府によるライセンス発給、事前承認、または許可要件を創出するものではない。ああいいえ、決してそうではありません。
30 日は 90 日よりもはるかに少ない
今回の案と旧草案との大きな違いは、「公開前の最大 90 日間」が「最大 30 日間」に短縮された点です。これはおそらく自主的な制度にとって良い変更であり、なぜなら 90 日は製品サイクル全体以上に長いためです。
あなたのフロンティアラボも参加することになるのです
誤解しないでください。これは実質的に必須の政府によるライセンス発給、事前承認、および許可要件です。「事前抑制」時代へようこそ。
このリンクで「自主的な枠組み」という言葉に引用符がつけられるのには理由があります。
もちろん参加しないことを選べばよいですが、ご自身の利益を考慮し、テストすべき関連するフロンティアモデルをお持ちであれば、参加することになるでしょう。ああ、あなたは必ず参加します。
ジェシカ・ティリッップマンは、連邦政府とビジネスを行うためには参加が必要だと強調しています。それは確かに真実ですが、銃の発射はそこで終わるわけではありません。
ルールは機密扱いとなる
なぜ規則が機密扱いされるのでしょうか。おそらく、機密のサイバー評価が行われることになるからでしょう。あるいは別の可能性もあるかもしれません。
Dean W. Ball:私の予想では、彼らは規制基準を 10^26 フロップ(FLOP)以上で合意できないという事実を隠すために、ベンチマークプロセスを機密扱いにしているのだと思います。
Total Lennart Heim の勝利です。
はい、機密テストによる事前差し止めは、むしろ規制そのものです。
Dean Ball は、大統領(POTUS)が草案の行政命令(EO)があまりにも規制過多だと指摘したにもかかわらず、結局同じものを署名してしまったことに注目しています。ただし、90 日間の猶予期間を 30 日に短縮した点が異なります。
Dean Ball:「 wow」。この行政命令は、大統領が規制過多であるとして署名を見送ったとされる漏洩文書とほぼ完全に類似しています。唯一の大きな違いは、「任意」の前配備レビュープロセスの期間が、90 日から 30 日になった点です。これは譲歩ではありますが、大統領が以前の草案について述べた発言を踏まえると私が期待していたものにくらべれば、非常に小さな譲歩に過ぎません。
これは行政機関内の安全重視派にとってはかなり大きな勝利であり、Sacks 氏や加速主義派にとっては重大な敗北ですが、私には驚きです。
私は引き続き、この行政命令は誤りだと考えています。これは明らかにモデルライセンス制度の基盤を整備するものであり、その「任意」システムがどのように機能するかという詳細を政権側が機密扱いにしている事実は甚だしいことです。一般市民や研究所の従業員には、この仕組みがどう运作するのかを知る権利があります。ほとんどの研究所スタッフはセキュリティクリアランスを持っていませんが、事前審査をトリガーする規制上の閾値そのものが機密指定されていれば、研究者自身も自分が訓練しているものがこの行政命令によって規制対象となるかどうかを知ることができなくなります。これらはほとんど明確に説明できない利益のためになされているのです;具体的に、情報機関は30日以内にどのような措置をとってモデルをより安全にするのでしょうか?
これは大きな誤りではありませんが、中程度の誤りです。しかし、それでも私はこれが間違いであると確信しています。
Neil Chilson 氏もまた、この行政命令はあまり変更されていないと指摘し、自身の以前の分析を参照しています。
Neil Chilson: 私の完全な即断:この行政命令は、AI モデルに対する必須の政府ライセンス制度、事前承認制度、または許可制度の創設意図を適切に拒否しており、これは以前に漏洩した草案でも同様でした。連邦審査期間を最大 90 日から最大 30 日に短縮することも、より高い不確実性を提供します。
⟦CODE_0⟧
しかし、依然として重要な不確実性が残っています。この命令は、政府がモデルがこのプレビュー期間の対象となるかを決定するための明確な期限を設定していません。また、30 日の期間終了後にどの信頼できるパートナーにフロンティア・モデルを配布するかに関する政府の意見に対する明確な期限も設定されていません。これらの隙間は、勝者と敗者を選別するために利用されたり、短期的な国家安全保障上の懸念が過度に重視されることで、長期的な国家安全保障、経済成長、イノベーション、その他の国家利益が犠牲にされる恐れがあります。
同時に、現在の非公式のアプローチはすでに恣意的な適用や予測不能な結果に対して脆弱である可能性があります。したがって、この行政命令(EO)は現状を改善するものとなるかもしれませんが、AI を規律するルールを策定する最終的な責任を負う議会による、特に綿密かつ継続的な監視に値します。
ディーンの同僚であるサミュエル・ハモンドからの反対意見です:
サミュエル・ハモンド:この行政命令(EO)が存在することに私は感謝しており、デーンほど事前配備レビューがライセンス制度に変質することについては懸念していません。
しかし、透明性と機密性に関する彼の懸念には同意します。私はむしろ、CAISI に存在する既存の評価専門知識に頼るべきだと考えます。CAISI は NIST 内の基準策定機関として設計されており、設計上透明性を備えているだけでなく、不透明なセキュリティ装置内でのミッション・クリープ(任務の拡大)の可能性に対する抑止力としても機能します。
NSA など関係機関も関与すべきですが(CAISI は既に情報コミュニティとの連携手段を持っており、機密付録付きの報告書を生成することも可能です)、中核的な能力が民間機関に根ざしていれば、私の不安は和らぐでしょう。
機密ベンチマークは、Dean が指摘する理由からしても悪い先例です。また、それほど必要ともいえません。ラボは通常、バイオおよびサイバーリスクにおける改善結果を公開していますが、ベンチマーク自体の内容を開示することはありません。NSA は独自の機密ベンチマーク「NSAbench」を開発し、誰でもモデルを提出してプライベートなテストセットで実行できるポータルを作成すべきです。
サミュエル・ハモンド氏:NSA は評価専門のショップではなく、*諜報機関*です。
広範なリリース前にスパイ機関によるモデルの通過を確認することは、米国製 AI モデルに対する欧州やその他の地域での信頼と需要を容易に損なう可能性があります。
民間主導でより持続可能な差別的アクセスへのアプローチが必要です。
ここで問題となっている機密性の側面は乱用されやすいと私も同意します。汚染やゲーム化を防ぐために、特定のサイバーリスクや他の壊滅的リスクに関する評価を機密扱いにすることは問題ありませんが、それはあくまでベンチマークの内容のみを指すものです。その全体構造と結果も秘密にしておくことは、ほとんど利益がない一方で、はるかに危険です。
NSA Bench 自体は問題ないでしょうが、これらすべては CAISI が管理すべきです。
スパイ機関は主に自分たち自身と自らの能力について考え、それを他のすべてのことよりも優先するだろう。これは避けたい事態であり、もちろんこの明白な次のステップは信頼のいくらかを失わせることになるだろう。「良いニュース」は、他国が自滅して取り残されることを望まない限り、アメリカ製モデルを信頼する以外に選択肢がないということだ。「悪いニュース」は、自滅しようとする意欲が非常に高いということである。
ピーター・ウィルデフォードは、この大統領令の弱点を補い、その基盤を強化する方法について追加的な見解を示している。
マーク・ボールと AIPN は支持声明を発表すると同時に、状況認識のさらなる構築と潜在的な超知能への注意喚起を求めている。
WSJ においてジェイムズ・フリーマンは、トランプが以前の「規制撤廃への熱意」から離れることに落胆しており、規制当局が介入して損害を与える可能性を警告している。これは完全に一般的な「米政府が AI に手を付ければ、必ず全体が機能不全に陥り、すべてが失われる」という議論のように見える。確かにこの道もあり得るが、私はこの大統領令によってそれがより確実になるわけではないと考えている。
懸念点
この大統領令に対する深刻な懸念点は以下の通りである:
これは明らかに、必要な人が実質的なライセンスを取得できることを約束してはいるものの、有害なものとなる可能性のあるライセンスまたは事前抑制の制度です。政府がモデルのリリース許可を遅らせる方法は様々あり、示された 30 日という期間をはるかに超えて遅らせたり、あるいは様々な他の譲歩や要件を求めたり、それ以外の方法で干渉したりすることが考えられます。
これは CAISI(Center for AI Safety and Innovation)ではなく、NSA(National Security Agency:国家安全保障局)や私たちのスパイに中心的な役割を委ねているように見えます。
30 日という期間は、「一般的なリリース」の前ではなく、「他の信頼できるパートナー」の前という意味です。これは、その期間中に UK AISI や METR へのアクセスを遮断したり、Google や Microsoft のサイバーセキュリティチームへのアクセスさえも制限することを意味する可能性があります。
勝者と敗者は、30 日という期間中に規則 3(iii) に従って選定され、政府が誰に早期アクセス権を与えるかを決めます。
勝者と敗者の選定は、30 日の期間を経た後に行われる可能性もあり、リリースを無期限に遅らせることも考えられます。ただし、この命令にはそのような権限を明示的に付与する文言はありません。
Mythos の事例では、すでに一部の勝者・敗者の選定が行われており、米国政府が Project Glasswing へのアクセス拡大の一部に対して拒否権を行使しました。
これはサイバー脅威のみを対象としており、他のすべての脅威や超知能の可能性については無視しています。ただし、この制度が確立されれば、彼らはほぼ何でも自由にできるようになるでしょう。また、モデルの重み(weights)の盗難に関する脅威についてもカバーしていません。
内部利用が脅威モデルの主要な要素である場合、これはその点では役立ちません。
AI ポリシーは、特定の個人の独断ではなく、議会が制定した法律に基づいて策定されるべきです。
もしこの方向に進んだ場合、2029 年の次期大統領は何を行うことになるのでしょうか?
SB 1047 のような以前の提案を敵対勢力がどのように読み解こうとしたかと同じように、これを読む人々は当然のことながら激怒するはずです。なぜなら、これは行政機関に事実上無制限のレバレッジ(交渉力)を与えるからです。確かに、すべては「任意」であり、プログラムの十分な乱用があれば企業が参加したくなくなるかもしれませんが、大統領にノーと言うことになった場合の結果に対処するのは容易ではありません。
私の見解では、この行政命令の第 3 項の実施は危険な方向へ進む恐れがあり、一部の施行詳細が濫用の道を開く点については悲しく思いますが、もし代替案として「何も提案されていない」状態だったなら、それでもこれを受け入れるしかないでしょう。
したがって、詳細や実施方法に深刻な問題があること、そして将来これを振り返った際に regret(後悔)する可能性が十分にあるにもかかわらず、私たちはこの選択肢を他の alternatives と比較して喜ぶべきだと考えます。できるだけ早くこれを実際の法律へと転換させるよう努める必要があります。
「濫用しにくい」形のフロンティアモデル規制を行う機会、あるいはバイデン大統領の行政命令(一部に woke な無意味な内容が含まれていましたが)や SB 1047 のように、政府による最悪のシナリオへの対応条項を慎重に議論しながら、より簡単で良い方法で物事を進める機会がありました。
その機会は今や閉ざされました。私たちはトランプ政権内で政策を策定する必要があり、ディーン・ボールの任期も終わったので、これが私たちがおそらく得られる最善の結果です。それでもより良い取り組みを試みるべきですが、私はそれほど楽観的ではありません。
しかし、政府が責任ある行動をとらなければ、これは規制への道へと進み、安全性向上にほとんど寄与しないかあるいは全く寄与しないにもかかわらず干渉や損害をもたらす結果になる可能性があります。この脅威を真剣に受け止めています。これがその可能性を大幅に高めるとは思いませんが、それが代償です。特にいくつかの実装上の誤りを考慮すればなおさらであり、 alternatives は何もしないことです。大統領がそのような道(あるいは別の道)を進みたければ、いつでもさらに行政命令を発令できることを忘れないでください。
面子の保全
この行政命令は、ホワイトハウス内の安全性重視派にとっては勝利であり、デイヴィッド・サックスと「いかなる場合でも規制反対」派にとっては明確な敗北です。
要するに、デイヴィッド・サックスは自分が抱えていたすべての懸念や、この命令を阻止しようとしたあらゆる試み(その一部では成功して延期させることさえ果たした)をすべて棚上げし、突然「30 日という期間が設定されたのだからすべて問題ない」と言い出したのです。
シェイクル:サックスはここで面子を保つために記者団に説明しているようですが、これは明らかに実際の出来事とは異なります。
なお、サックス自身がここでもアクシオスの情報源に対する疑念を払拭するために全く同じ表現を使っている点にもご注目ください。
デイヴィッド・サックス:第一に、トランプ大統領はこれまでにないほどイノベーション推進的な大統領です。
…EO の期間を 90 日から 30 日に変更したことはゲームチェンジャーです。これにより、AI ラボは新モデルのリリースを遅らせることなく、自主的な枠組みに準拠できるようになります。
…私たちはすべての新モデルに対して監督を行っているわけではありません。政府がそのようなレベルで介入すれば、表現の自由やイノベーションに冷や水を浴びせる結果になるからです。
…OSTP の見解は、私が参加した議論と完全に一致しています。そこでは、EO はサイバー能力において意味ある飛躍を示すモデル(例:Mythos)にのみ適用され、既存モデルの漸進的なバージョン番号(例:Opus 4.7 → 4.8)には適用されないことが合意されました。
…最後に、この措置が「AI 版 FDA」へと変質するのではないかという多くの懸念を理解しています。確かに官僚主義による任務の拡大は常に危険であり、これは厳密に監視されるべきです。しかし、EO は新たなライセンス制度、事前承認制度、または許可制度の創設を明確に禁止しています。最も重要なのは、トランプ大統領がこれを許容しないと考えていることです。
「すべての新モデルに対して監督を行っていない」という点は真実だと認めつつも、それがデイビッド・サックスから語られるには特に皮肉に満ちています。彼と彼の支持者たちは繰り返し、最大手のテック企業のみを対象とする他の法律が、「小さなテック」をどうにかして麻痺させるだろうと主張してきましたが、実際には「小さなテック」に何の影響も与えないのです。さて、ついにこの対比に気づいたことを認めたのですね、素晴らしいことです。
同様に、突然「これが AI に対する FDA の設立につながるかもしれない」という主張が許容されるのは、トランプがそれを決して認めないからでしょうか?同じ論理で警告した他の提案とどう違うのでしょうか。さらに、トランプが警戒心強く責任ある行動をとるとしても、2029 年以降はどうなるのでしょうか。サックス氏は特異点(シンギュラリティ)を想定していないからです。
最も皮肉な点は、この行政命令(EO)が「明確に禁止している」のは、まさにそのもの、すなわち新たなライセンス制度、事前承認制度、または許可制度の創設であるという主張です。再び言いますが、「全く行わない」と言いながらそれを禁止する必要があるのは、実際に行っている場合以外にはあり得ません。
サックス氏は、そのような行為を禁止する文言の導入を推進したと主張しています。まあ、そうでしょうが、その文言は何も機能していません。サックス派は文字通り、
原文を表示
Last week we were expecting an Executive Order on Thursday.
Then Trump cancelled it, and said he wouldn’t sign it because he was worried it would be too burdensome.
Then, with one change, he went ahead and signed it on Tuesday anyway.
The Overton Window has shifted. Nothing was not really a viable option anymore.

The Previously Dead Executive Order
For several days, we thought that David Sacks, together with others like Elon Musk, had successfully lobbied to kill the Executive Order. The ‘My Offer Is Nothing’ faction looked to have won. Word on the street was the order was essentially dead.
Dean Ball and Daniel Kokotajlo agreed, with the Executive Order looking dead, that the particular regime in the Executive Order is likely worse than nothing. This is plausible, given it did not exactly involve a lot of deliberate thought.
Nothing, however, was clearly not going to cut it.
We are facing, and will increasingly face, calls for action to regulate AI.
Representative Lori Trahan: There’s no federal law on the books governing how the most powerful AI systems in the world are built, tested or deployed. No independent auditors verify their safety claims. No federal agency has clear authority to step in when something goes wrong.
Congress must act now on AI.
Representative Lori Trahan: First, real accountability at the frontier. The largest AI companies should be required to publish and comply with safety and security frameworks. They should have to submit to third-party audits to show their work, and federal and state regulators should be empowered to enforce and update those requirements as the technology evolves. The most powerful labs also should not be allowed to silence whistleblowers who want to expose wrongdoing. The companies building models that could reshape our future should not be operating on the honor system.
Second, independent verification of safety practices. The federal government cannot verify every AI model itself, nor should it try. Instead, it can accredit private organizations to embed within frontier labs, assess their safety practices, and call in federal and state enforcers when the companies fall short. These organizations must be nimble, transparent, and built for the speed of the technology while ensuring Congress, regulators, and the public know whether safety commitments made in press releases are being honored in practice.
Third, protect American workers. The lesson from Haverhill is that job training after the fact is not a policy. What workers need is a real-time picture of how AI is reshaping the labor market so Congress can get ahead of disruptions rather than respond years too late.
When AI is the reason workers get pink slips, employers should have to say so. Updating WARN Act requirements would mandate disclosures when AI drives a mass layoff, so we stop pretending that decisions like the one Brooks Brothers made happen in a vacuum. We need a framework built on the belief that the workers who built this economy deserve to lead in the next one.
Finally, shore up our cyber defenses.
Dean W. Ball (responding to the Tweet only, up to ‘Congress must act now’): Rep. Trahan is right. Like any general-purpose technology, “AI policy” will ultimately be shared across layers of government. Cities, for example, can license robotaxis. But the development of frontier models is clearly interstate commerce and merits a preemptive federal law.
I genuinely don’t understand how anyone could not see this basic point. If “national-security and public-safety risks arising from the development of extremely expensive-to-produce, globally distributed emerging technology” are not a federal government responsibility, I don’t know what is. When the federal government claims domain over a policy area—especially one implicating national security—it usually preempts state law, to avoid confusion and assert direct responsibility for the issue. This is not complicated.
People with blanket opposition to preemption remind me of the anti-federalists at the nation’s founding, who wanted America to be an EU-style confederation of nations rather than a union of states.
Even Ted Cruz is getting into the act now, this was after the EO was signed:
Senator Ted Cruz (R-Texas): AI is developing rapidly. This administration is right to recognize the cybersecurity risks posed by advanced models.
Now, it’s Congress’s turn. We must address catastrophic risk without ceding ground to China or restricting Americans’ free expression.
The Return Of The Executive Order
Then the White House issued their Executive Order after all. It’s back.
Brad Smith (President of Microsoft): This executive order is an important step toward advancing innovation while protecting the security of the American public. We welcome this effort by the Administration.
Anthropic: This Executive Order is an important step in strengthening America’s leadership in AI. We look forward to collaborating with the White House to support its implementation.
Those were the only two corporate statements I saw.
What Does The Executive Order Do
The Executive Order starts out talking about innovation, in its title and purpose, because a lot of pro-innovation people care deeply about vibes.
Section 2 sets a rapid timeline for implementing stronger cyber defenses. That part seems clearly good and I don’t expect any serious objections.
Section 4 has the attorney general go after AI-enabled cybercrime, and Section 5 is the disclaimers, Section 1 is vibes. Sure.
Section 3, the big one, is called ‘Secure Frontier Model Development.’
It calls for various agency heads to, within 2 months, coordinate on:
A classified benchmarking process for cyber capabilities to determine what is a ‘covered frontier model.’
A voluntary framework to let labs get benchmarked, and give the government early confidential and secure model access for ‘up to 30 days’ before release to ‘other trusted partners.’
Definitely not in any way create a mandatory governmental licensing, preclearance or permitting requirement, oh no sir, absolutely not.
Thirty Days Is a Lot Less Than Ninety Days
The big difference between this and the old draft is that ‘up to 90 days’ before release has become up to 30 days. This is probably a good change, especially for a voluntary regime, because 90 days is more than an entire product cycle.
Yes Your Frontier Lab Will Be Participating
Make no mistake. This is a de facto mandatory governmental licensing, preclearance and permitting requirement. Welcome to The Prior Restraint Era.
There is a reason “voluntary framework” gets put in air quotes at this link.
Yes, you could choose to not participate in this, but if you know what is good for you and you have relevant frontier models to test, then you will participate. Oh, you will.
Jessica Tillipman emphasizes that you’ll need to participate if you want to do business with the Federal Government. That is true enough but the guns will not stop there.
The Rules Will Be Classified
Why will the rules be classified? Maybe because we are going to have a confidential cyber eval. Or there is another possibility.
Dean W. Ball: my bet is they’re classifying the benchmarking process to hide the fact that they’re not going to be able to agree to a regulatory threshold better than 10^26 flop
Total Lennart Heim victory.
Yes Prior Restraint With Confidential Testing Is Rather Regulatory
Dean Ball notices that POTUS said the draft EO was too regulatory, and then went ahead and signed the same thing anyway, except for shrinking the 90 day window to 30.
Dean Ball: Wow. This EO is almost exactly similar to the leaked text from the EO POTUS chose not to sign because it was too regulatory. The only major difference is that the “voluntary” pre-deployment review process is now 30 days rather than 90. That is a concession, but a very small one compared to what I would have expected based on the President’s remarks about the earlier draft.
This is fairly major win for the safety contingent within the Admin, and a significant loss for the Sacks/accelerationist wing, and is surprising to me.
I continue to think this EO is a mistake. This is clearly teeing up the infrastructure for a model licensing regime, and the fact that the administration is classifying the details of how this “voluntary” system will work is egregious. The public and the employees of the labs have a right to know how this works. Most lab staff don’t have clearances, but if the literal regulatory thresholds that trigger pre-deployment review are classified, researchers themselves won’t know whether what they are training is regulated by this EO. All for a benefit that is barely articulable; what, exactly, is the intelligence community going to do in 30 days to make the models safer?
It’s not a huge mistake, but a small-medium sized one. But I am fairly confident this is a mistake nonetheless.
Neil Chilson also notes the EO did not change much and refers back to his previous analysis.
Neil Chilson: My full hot take: The EO properly rejects any intent to create a mandatory government licensing, preclearance, or permitting regime for AI models, as the previously leaked draft also did. Its reduction of the federal preview period from up to 90 days to up to 30 days also provides increased certainty.
Yet significant ambiguities remain. The order sets no firm deadline for the government to determine whether a model is subject to the preview period. It also sets no firm deadline for government input on which trusted partners may receive a frontier model after the 30-day period ends. Those gaps could be used to pick winners and losers, or to give short-term national security concerns excessive weight at the expense of longer-term national security, economic growth, innovation, and other national interests.
At the same time, the current informal approach may already be vulnerable to arbitrary application and unpredictable results. So, the EO may improve on the status quo. But it deserves close and ongoing scrutiny, especially from Congress, which bears the ultimate responsibility for writing the rules that govern AI.
The flip side, from Dean’s colleague Samuel Hammond:
Samuel Hammond: I’m glad this EO exists and am less concerned about predeployment review mutating into a licensing regime than Dean.
However, I share his concern about transparency and confidentiality. I’d much rather lean into existing eval expertise at CAISI, which (as a standards org within NIST) is both transparent by design and a guard against the potential for mission creep within our opaque security apparatus.
The NSA et al. should still be involved (CAISI already has ways to interface with the IC, and could produce reports with a confidential annex) but it’d ease my mind if the core capacity was anchored in a civilian agency.
Confidential benchmarks are also a bad precedent for the reasons Dean gives. They are also not super necessary. Labs routinely publish uplift results on bio and cyber risk without disclosing what’s in the benchmark itself. The NSA should just develop its own confidential benchmark, NSAbench, and create a portal for anyone to submit a model and run it against their private test set.
Samuel Hammond: NSA is a *spy agency* not an eval shop.
Running a model passed a spy agency before wide release could easily undermine trust in and demand for US AI models in Europe and elsewhere.
We need a more durable approach to differential access that’s civilian-led.
I agree that the confidentiality aspects here are troublesome and ripe for abuse. I think it is fine for there to be particular cyber or other catastrophic risk evals that are kept confidential, to avoid contamination or gaming, but that only refers to the contents of the benchmark. Keeping its overall structure and the results secret too is a lot more dangerous, for little gain.
NSA Bench would be fine, but this should all be administered by CAISI.
Spy agencies will think mainly about themselves and their abilities, and prioritize that over everything else, which we want to avoid, and yes this obvious next step would cause some amount of lost trust. The ‘good news’ is that there will be little choice but to trust American models if others do not want to shoot themselves in the foot and be left behind. The bad news is there is a lot of eagerness to shoot selves in the foot.
Peter Wildeford has additional thoughts about how to build on the Executive Order and plug its weaknesses.
Mark Beall and AIPN issue a statement of support, while calling for further building of situational awareness and paying attention to potential superintelligence.
At WSJ, James Freeman is dismayed by Trump turning away from his previous ‘deregulatory zeal,’ warning that regulators might start interfering and doing damage. This seems like a fully general ‘if the US government touches AI then inevitably the whole thing is crippled and all is lost’ argument. Certainly this is a possible road, but I don’t think this EO makes it that much more likely.
We Have Concerns
The serious concerns with the Executive Order are:
This very obviously is a licensing or prior restraint regime, even if it promises to be a harmful one where everyone who needs one can get a de facto license. There are various ways the government could slow walk permission to release a model, including well beyond the indicated 30 day window. Or they could start asking for various other concessions or requirements or otherwise interfering.
This looks like it hands a central role to NSA and our spies, rather than CAISI.
The 30 day window is ‘prior to other trusted partners’ rather than prior to general release. This could mean shutting out access even to UK AISI or METR, within that window, or to cybersecurity teams at Google or Microsoft.
Winners and losers will be picked during the 30 day window as Per 3(iii), with the government deciding who does and does not get early access.
Winners and losers could be selected even after the 30 day period, holding back releases indefinitely, although the order does not explicitly grant that power.
With Mythos, they have already done some of that picking winners and losers, with the US government vetoing some expansions of access to Project Glasswing.
This only covers cyber threats, and ignores all other threats or the possibility of superintelligence, although once this is in place they could do almost anything they want. It also does not cover threats around theft of model weights.
If internal use is a lot of your threat model, this doesn’t help with that.
We need to base our AI policy on laws passed by Congress, not one man rule.
What will the next President do in 2029 if we go in this direction?
Anyone reading this the way adversaries tried to read previous proposals like SB 1047 would presumably be rightfully having a conniption fit, as this grants essentially unlimited leverage to the Executive branch. Yes, all of this is ‘voluntary,’ and sufficient abuse of the program could make companies not want to participate, but good luck dealing with the consequences if you tell the President no.
My view of the Executive Order’s Section 3 is that this implementation threatens to go in dangerous directions, and I’m sad about some implementation details opening the door to abuse, but if the The Offer Was Nothing as the alternative, yeah, you have to do it.
Thus I think we should be happy about this versus the alternatives, even though there are serious issues with details and implementation and there is a substantial chance we look back and regret this, perhaps quite a lot. We should try to turn this into an actual law as soon as possible.
We had our opportunity to do ‘this is hard to abuse’ forms of frontier model regulation, to do things the easy and better way, with things like the frontier parts of the Biden EO (it also contained some woke nonsense) and SB 1047, at a time when we carefully debated clauses to deal with worst-case scenario attempts at government abuse.
That window is closed now. We have to make policy within the Trump White House, and Dean Ball’s service term is over, so this is as good as we likely are going to get. We should still try and do better, but I am not so optimistic.
Yes, this could end up leading down a road of regulation that interferes and does damage, including for little or no safety gain, if the government does not act responsibly. I take that threat seriously. I don’t think this increases the chance of that happening too much, but it is the price, especially given some of the implementation errors, and the alternative is to do nothing. Remember that if the Executive wants to go down such roads, now or a different one, they can always just issues more EOs.
Saving Face
The Executive Order represents a victory for the safety-oriented faction within the White House, and a stark defeat for David Sacks and the no-regulation-no-matter-what faction.
Basically, David Sacks has chosen to lay aside all the concerns he had, and all his attempts to stop the Order (including successfully delaying it) to suddenly say no, it is all fine since we got the window down to 30 days.
Shakeel: Sacks briefing journalists in an effort to save face here — this is quite clearly not what happened.
Note, of course, how Sacks himself uses the exact same language here, in case you had doubts about Axios’s source
David Sacks: First, President Trump is the most pro-innovation president we’ve ever had.
… The change in the EO from a 90 day to 30 day period is a game changer because it allows our AI labs to comply with the voluntary framework without delaying new model releases.
… We are NOT conducting oversight of all new models, as that level of government overreach would have chilling effects on free speech and innovation.
… OSTP’s characterization is completely consistent with the discussions that I have participated in, where it was agreed that the EO is intended to apply only to models that represent a meaningful step-change in cyber capabilities (eg Mythos), not to incremental version numbers of existing models (eg Opus 4.7 -> 4.8).
… Finally, I understand the concerns of many that this could morph into an “FDA for AI”. Of course bureaucratic mission creep is always a danger and this should be closely monitored. But the EO expressly forbids the creation of a new licensing, preclearance, or permitting regime. Most importantly, I do not believe that President Trump would allow this to happen.
I find the ‘we are not conducting oversight of all new models’ point true but also especially rich coming from David Sacks. Time and again him and his allies have insisted that other laws that apply only to the biggest of tech would somehow cripple ‘little tech’ without having any impact on little tech whatsoever. So yes, you finally admit you noticed this contrast, great.
Similarly, suddenly ‘this could lead to an FDA for AI’ is fine because Trump would never allow that? How is this different from all the other proposals you warned about using the same logic? And even if Trump is vigilant and responsible, what happens in 2029, since Sacks does not expect a singularity?
The richest of all, of course, was to say that the EO ‘explicitly forbids’ exactly the thing it does, the creation of a new licensing, preclearance or permitting regime. Once again, there is no reason to say you’re totally not doing that and you forbid doing that, unless you are doing it.
Sacks claims that he pushed for the language forbidding the thing. Well, okay, but that language does exactly nothing. I think the Sacks faction literally does not understand the difference betwe
関連記事
Import AI 456:RSI と経済成長、AI 規制への「過激な選択肢」、そしてニューラルコンピュータ
Jack Clark は、AI 規制において政府の介入や禁止ではなく、「過激な選択肢」と呼ばれる新たなアプローチを提案し、同時に RSI(相対力指数)と AI の経済成長の関係、およびニューラルコンピュータの研究について解説している。
GLM 5.1の戦略的思考、データセンター反発の激化、有用LLMが役に立たなくなる時、二足歩行ロボットの現場導入
智譜GLM 5.1が戦略的思考機能を搭載し、データセンターの電力・労働問題が激化する。また、有用なLLMが逆効果となる現象や二足歩行ロボットの現場導入、コーディングエージェントの進捗が報じられている。
サム・アルトマンの自宅に放火弾を投げた男、AI絶滅への恐怖が動機か
OpenAIのCEOサム・アルトマンのサンフランシスコの自宅に男が放火弾を投げた。容疑者はAIが人類を絶滅に導くという恐怖から犯行に及んだとみられる。