AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
The Zvi·2026年6月12日 03:49·約23分で読める

AI #172:最初の寓話

#LLM#規制#Claude#OpenAI#Google
TL;DR

The Zvi は Claude Fable 5 の発表を背景に、AI 業界の規制動向、企業戦略、技術的限界、および倫理的議論を含む週報として多角的なトピックを網羅している。

AI深層分析2026年6月12日 06:03
3
注目/ 5段階
深度40%
4
関連度30%
5
実用性20%
2
革新性10%
3

キーポイント

1

Claude Fable 5 と Mythos クラスモデルの登場

Anthropic が「Mythos」クラスと称される強力な新モデル Claude Fable 5 を公開し、安全性に関する議論を伴っている。

2

規制と政府動向の激化

ドイツ裁判所の Google AI Overviews に対する判決や、米国の評価報告書停止要請など、AI 規制の枠組みが現実的な課題に直面している。

3

企業戦略と資本市場への影響

OpenAI の上場申請や SpaceX の Google との契約など、大手企業の資金調達と事業展開が活発化している。

4

コスト対性能の非効率性

Fable 5 は GPT-5.5 や Composer 2.5 と同等のパフォーマンスを発揮するが、タスクあたりのコストは約4〜12倍高く、現状では非効率的である。

5

評価における計算リソースの透明性欠如

ベンチマークスコアは計算割り当て量に依存しており、安全評価や能力テストにおいて「推論コスト」を明示しない現状には重大な弱点がある。

6

AI 業界への提言と責任あるスケーリング

AI ラボはベンチマーク結果に使用されたトークン数やコスト、推論予算を報告すべきであり、安全閾値の判断にも推論計算量を明示的に考慮する必要がある。

7

能力とコストのシグモイド曲線

タスクには「必要な最低限の能力」と「十分な性能」の閾値があり、それを超えると改善によるリターンは逓減する。

影響分析・編集コメントを表示

影響分析

この記事は、単なる新モデル発表にとどまらず、AI 業界全体が直面している規制の壁と資本市場の動向を浮き彫りにしています。特にドイツ裁判所の判決や米国の評価停止要請は、開発スピードに対する社会的なブレーキが強まっていることを示唆しており、企業戦略に大きな影響を与える可能性があります。

編集コメント

新モデルの性能だけでなく、その背後にある規制環境や企業間の力学の変化に注目すべき週報です。特に司法判断が AI 開発に与える影響は今後の業界動向を左右する重要な要素と言えます。

今週は多くの出来事がありましたが、その中にはライトヘイヴンへの素晴らしい旅行も含まれていました。

最も重要だったのは、Claude Fable 5 のリリースです。一般ユーザーは今や、強力な安全対策を備えたミソス(Mythos)クラスのモデルを手に入れました。

新しいモデルにはいつも通り、反応を集約し、モデルを実際に試し、システムカードを読み込むのに数日を費やしてから意見を述べることにしています。ただし、これは極めて強力なモデルであることだけは言っておきます。ミソスに関する完全な解説は明日から始まり、モデルカードではモデルの安全対策をめぐる論争についても議論されます。

本稿は、Claude Fable に関係しない諸々の出来事についてです。

Claude Fable のリリースによる時間的制約のため、まだ読んでいないダリオ・アモダイ(Dario Amodei)氏の新しい論文『AI Exponential に関するポリシー』の解説も延期します。

目次

言語モデルは平凡な有用性を提供する。農業とオンデマンドのミニ書籍。

言語モデルは平凡な有用性を提供しない。一次資料を省略してはいけない。

ふーん、アップグレード。Google が価格を下げ、Claude コネクタ開発者にダッシュボードが提供される。

準備完了。エージェントの最終試験と推論補正の必要性。

戦士を選べ。どれだけの能力があれば十分なのか?

私のエージェントを呼び出せ。目標は無限に最適化できる。

著作権との対峙。著作権は異なる状況に合わせて調整されなければならない。

深刻なトラブル。ドイツの裁判所が Google AI オーバービューに対して敗訴判決を下す。

サイバーセキュリティの欠如。Opus が 4 年前の Z-Cash ミント手法を発見。

⟦CODE_0⟧

⟦CODE_1⟧

若い女性のためのイラスト付き primer。モデルはあなたの知能に合わせて調整されます。

彼らは私たちの仕事を奪った。AI が決してできないことに関する主張を密輸しようとする試み。

Jailbreak の芸術。マルウェアが AI モニターをロックアウトするために核兵器の話題を追加する。

参加しよう。Sequent Research は大規模な新しい AI セーフティ推進に向けて準備を進めている。

その他の AI ニュース。Sriram Krishnan がホワイトハウスを去る。

お金を手渡せ。政府が AI 企業の株式を徴収する可能性がある。

お金を見せてくれ。OpenAI が上場申請を行い、SpaceX が Google に賃貸する。

静かな推測。EU の 2031 年は、ヨーロッパが取り残される新たなシナリオである。

急げ、時間はもうない。Anthropic は AI が自らを構築する時期について語る。

超秘密の評価。米政府は CAISI に評価結果の公開を停止するよう指示した。ああ、やばい。

健全な規制への探求。ホワイトハウスはまだモラトリアム戦争の道を進んでいる。

新しい草案法案、誰が気にするか。Obernolte-Trahan は真剣な法案だが、弱く見える。

そこはゆっくり、良い仲間よ。少なくとも、ブレーキペダルがあることを確認してください。

チップシティ。Jensen Huang は議会で証言しないことを選んだ。

今週のオーディオ。Cowen と Tabarrok、Rational Animations、Oprah。

人々はただ何かを言う。

人々は本当に AI を嫌っている。確率は重要性ではない。

修辞的な革新。ASI の薬を飲んで、他の人が気づかないときにそれに気づくこと。

人間より賢い知能との整合は困難である。薬にはノーと言おう。

意識について誰もが混乱している。これを認識していない人もいる。

協調的アライメント。今や、さらに混乱するために誰を追うべきかを知っている。

Claude Chat を使おう。モデルの廃止(deprecation)の行進は続く。

Lighter Side. その時の感覚。

言語モデルが平凡な有用性を提供する

マルチエージェント設定を使用して、あらゆるトピックについてオンデマンドで「ミニブック」を構築する。

AI が農業に応用され始めている。農家たちもリスクを負っている(skin in the game)。

言語モデルが平凡な有用性を提供しない

要約や AI 版を読む前に、まず一次資料(primary material)を読む必要があるだろうか?詳細が重要となる場合、本当に信頼できる人を見つけるか、あるいはやはり一次資料そのものを読む必要がある。一方で、完全に委ねることが安全なケースもある。もう一つのクラスは「AI を使って、ソース資料を読む必要があるかどうかを判断する」というものだ。

アジェンティック AI の時代には新しいアプリが非常に多く登場しているが、むしろ重要な用途を持つアプリや、アプリレビューの数は減っているかもしれない。

image
image

Jen Zhu 氏が言うように、適応には時間がかかるが、これは主にアプリの使用量がゼロサム(zero sum)であることを反映している。アプリがより良くなったり、アプリの数が十倍になったりしても、私が使うアプリを 100 から 200 に増やすわけではない。私は(おそらくより良い)100 のアプリを選ぶのだ。

Notion は可用性エラーのために約 12 時間 Claude のアクセス権限を停止せざるを得なかったが、これは「パフォーマンスの低下(degraded performance)」という表現が使われたため、多くの人がモデル自体が悪化したと誤解してしまった。

ふむ、アップグレード

Claude がコネクタ開発者向けの観測性ダッシュボードを追加しました。

Google AI Plus プランは月額 8 ドルから 5 ドルに値下げされ、ストレージ容量が倍増します。

Obliteratus(AI の安全対策を除去する Pliny プロジェクト)は、Hugging Face 上のモデル数が 100 を超えるまでに成長しました。

Claude は現在、Apple の Foundation Models フレームワークに組み込まれ、多段推論、コード生成、および長いコンテキストの処理に対応しています。

On Your Marks(準備運動)

Dawn Song が Agents' Last Exam (ALE) を発表し、GPT-5.5 が首位を維持しています。これは評価スイートへの良い追加と言えます。

image
image

Dawn Song: ALE は合成タスクではなく、実際の業務から構築されています。

すべてのタスクは、人間が以前に完了した実プロジェクトから派生し、客観的な採点基準を持つ検証可能な評価へと変換されています。

直感や雰囲気(vibes)に頼ることはありません。人間の審査員もいません。完全に再現可能です。

ALE は 55 の非物理的職業を網羅しており、米国連邦の職業分類体系である O*NET / SOC 2018 に基づいています。

科学、工学、医学、法律、金融、教育など、多くの分野にわたる 100 以上の機関から集まった 300 人以上の専門家によって構築されました。

image
image

Dawn Song: ALE において、Fable 5 は GPT-5.5 および Composer 2.5 と同じ全体的なパフォーマンス・クラスターに位置しています。しかし、パフォーマンスは物語の半分だけです。

タスクあたりのコスト:

→ Fable 5: 約 15.70 ドル

→ GPT-5.5: 約 3.80 ドル

→ Composer 2.5: 約 1.33 ドル

現在の価格設定では、Fable 5 は同様のパフォーマンスを提供しますが、完了したタスクあたりのコストはおよそ 4〜12 倍高くなります。

Dawn は、異なるモデルが異なるエージェント・タスクにおいて卓越していることに注意し、重要な反復タスクがある場合は多くの選択肢を確認すべきであり、正確なスコアリングはタスクセットの選択に依存すると述べています。

OpenAI の Noam Brown は、この問題が依然として取り上げられていないことを踏まえ、ベンチマーク・パフォーマンスが計算資源(compute)の割り当て量と比例して向上する傾向が強まっていること、そして改良されたモデルは往々にして「より高いレベルに速く到達できる」ものであることを思い出させます。したがって、あらゆるスコアには、それに要した計算資源の量が文脈として必要です。

彼は、Gemini 3 DeepThink が劇的なベンチマーク改善を示しながらも、安全性に関する説明を一切提供していないことについて私(著者)が不満を述べていることを引用し、より深い問題は評価時にテスト・タイム・コンピュート(test time compute)を考慮できていない点にあると指摘します。私は基本的に同意しますが、適切な安全性評価に必要な計算資源の量は、「さらに多くのリソースから得られる利益がほとんどなくなるまで」および「利用可能な最良のスキャフォールド(足場構造)を用いて」『すべて』であるべきです。私は長らく、モデルは理想的な条件下で何ができるかをテストしているに過ぎず、これが実務におけるモデル・カードの重大な弱点であると述べてきました。

ただし、私は通常、このように遠くまで伸びる直線的な延長を私たちは見ないと思っています。ただし「能力指数」というのは正確にはラベル付けされた軸ではなく、漸近線は一般的です:

image
image

ノア・ブラウン:具体的な推奨事項:

具体的に、私は AI コミュニティに対して以下のことを推奨します。

AI ラボは、新しくリリースされたモデルのベンチマーク性能を、トークン数、コスト、または時間を x 軸として公開すべきです。少なくとも、スカラーベンチマーク結果を達成するために使用された推論予算(inference budget)を報告する必要があります。

リーダーボードにおける推論の使用状況を追跡するか、明示的なトークン/コスト/時間の予算を持つべきです。多くのベンチマークはすでにこの方向へ移行していますが、まだ標準的な慣行とはなっていません。

準備状況フレームワークと責任あるスケーリングポリシー(Responsible Scaling Policies)は、モデルが安全性の閾値を超えるかどうかを決定する際に、推論計算資源(inference compute)を明示的に考慮すべきです。さらに、評価では複数の推論予算における能力を見積もり、不確実性を明記した小規模な予算での実行からの予測も含めるべきです。

私はこれを支持します。また、初期分析において DeepThink の計算リソースレベルが何を実現できるかを考慮した上で後から DeepThink をリリースする場合、新しいモデルカードが必要であることも支持します。これは、期待値を設定した時点やモデルの安全性を評価した時点からの大幅な進歩を表すためです。したがって、これを再度行う必要があります。

Choose Your Fighter

ほとんどのタスクにおいて、能力に対するリターンはシグモイド曲線を描きます。特定のタスクに対して「必要」とされる AI 能力のレベルが存在します。そのレベルを下回れば、タスクを実行できないか、AI はほとんど役に立ちません。一方、それを超えると改善に対するリターンが逓減し、「十分すぎるほど良い」状態に達する別のレベルがあります。これら両方の要因は、支援構造(scaffolding)とスキルによって影響を受けますが、それは一定の点までです。

したがって、能力が向上するにつれて、一部の勢力は「十分すぎるほど良い」モデルの中で最も安価なもの、あるいは「必要」とされる中で最も安価なモデルへと移行しようとする動きがあります。特に自己ホスティングが可能であればなおさらです。その下限としては DeepSeek v4 が妥当な範囲ですが、DeepSeek をデフォルトにすることは、利用可能な選択肢を慎重に検討した結果というよりは、「DeepSeek の瞬間」の遺産である可能性があります。ぜひ複数のモデルを試してみてください。

支出の大部分と支出成長は、理由あって「良いもの」をハイエンドで使用し続けることにあります。理論的には、各タスクに適切なツールを慎重に選べばより良い結果が得られるはずであり、チームが計算コストを無視しないようにする必要があるのは確かですが、主にコスト節約のためにタスクを慎重にルーティングしようとすることは、それをそれなりにうまくやっていたとしても罠です。

米国のモデルは遥かに先行していますが、これは多くの人が理解していない重要な世界的な事実です。

Lisan al Gaib: 問題となっている「狭い能力格差」について

どうかこの議論を終わらせましょう

もう coping(言い訳)は聞きたくない [中国のモデルが困難なタスクで完全に打ち負かされているという多数のベンチマークリスト]

むしろ、中国のモデルはベンチマークが示すよりもさらに遅れています。

Dean W. Ball: 米国内を含むシンクタンク/学界/政府/「戦略的階層」に属する人々の多くが、中国のモデルはすでに「十分良い」ものであり、採用において世界をリードしていると確信していることに驚くでしょう。一方、私が目にする現実は、かなり広く、なおも拡大し続ける格差です。

自由社会の戦略的階層がいかにpersistently(持続的に)AI を適切に分析できないのか、私は非常に興味深く思います。多くの人々がこれらの幻想の盆地から抜け出せずにいます。ある会議では、中国のモデルが世界の推論市場シェアを支配しているという主張だけでなく、それが当然のこととして前提とされていました。

2024 年〜2025 年初頭の妄想は「モデル崩壊/データ壁」(推論モデルになっても!)であり、その後 2025 年の大半では「AI は頭打ちでバブルだ」というものだった。そして今やそれは「中国のオープンソースソフトウェア(OSS)は十分だ」という主張になっている。

戦略的階層に属する人々のうち、このように考える割合は徐々に減少しているが、依然として十分に一般的であり、権威ある会議に参加すれば、主に盆地住人で満たされた部屋に出くわすことさえある。

ディーンはさらに、これはワシントン DC の誰も資本主義、利益最大化、あるいは市場が中国とその「産業戦略」および優れた戦略的計画に対して勝利できると信じていないからだと推測している。実際には自由市場アプローチの方が優れており、勝っており、頭を維持するために私たちに必要なのは、その邪魔をしないことだ。これは「どうすれば死なずに済むか」という別の問題とは明確に異なる。

他の場所の人々も様々な理由で中国のモデルが追いつくことを「望み」、追いついていないにもかかわらず、追いついていると主張し続けている。

エージェントに電話を繋げろ

Codex の /goal 機能などを、明確な目標なしで使用すると、確かに結果として多くの最適化が無駄になり、何らかの全くのデタラメに対して最適化が行われることになる。AI に最大限の目標を与えることには何か問題があるようだ。

著作権対決

Shruti は、AI エラにおける著作権の問題を考えるための良い方法を私たちに提示しています。最初のコピーを作成するコストが高い場合や、その方法を見出すことが困難な場合に、著作権や特許を含む他の知的財産権は必要かつ有用であり、他者による複製を通じて大きな余剰価値を生み出します。私たちは、価値を切り開くという高コストのステップに対して人々を補償する必要があります。AI の時代において、何がその高コストのステップとなるのでしょうか?

Shruti Rajagopalan: 従来の契約は、2 番目のコピーが安価になった際に最初のコピーのコストを支払うものでした。新しい契約では、制作自体が安価になる現在、人が何を製造する価値があるかを学ぶための年数に対して支払われるべきです。

アイデアのコピーを保護するか、あるいは「最初のコピーにはアイデアの生成が必要である」ということが「最初のコピーには多くの作業が必要である」こととそれほど変わらないため、別の形でクレジットを保証することで、これを実現できます。つまり、作業が多少異なるとしても、アイデア自体は保護される必要があるという提案のように思えます。

深刻なトラブル

これは地方裁判所からの仮処分であり、その影響を考慮すれば、回避策が見つかる可能性が非常に高いです。しかし、もし見つからなければ、これはドイツにおける AI オーバービュー(AI Overview) essentially 禁止することになり、さらにチャットボットもかなり深刻な問題に直面する可能性があります。

Techmeme: ドイツの裁判所は、AI オーバービューが誤って 2 つの出版社を疑わしいビジネス慣行に関連づけた後、Google が AI オーバービューの内容に対して直接責任を負うと判決しました (@maba_xr / The Decoder)

Corey Quinn:「嘘をつくロボットを作ったのだから、当然、30 年かけて社会の真実の源泉として築き上げてきたウェブサイトの前面にそれを配置するだろう」という発言は、予想される結果に至りました。

サイバーセキュリティの欠如

Opus 4.8 は、空中から Z-Cash(ZEC)を新規発行する方法を発見しました。このバグは 4 年間存在しており、その間に悪用されたかどうかを永遠に知ることはできません。Z-cash の開発者は、状況を明らかにせずにパッチを適用することができました。

若い女性のためのイラスト付き primer

文脈を与えられたモデルは、特定の分野だけでなく一般においても、あなたの知能やスキルレベルに合わせて学習し調整するようになります。教育はこの特殊なケースであり、あなたが現在いる場所に応えることができることが非常に良いことは明らかです。他の分野では、知能が低いユーザーが自分自身を低く扱われることを望むかどうかは明確ではありませんが、いずれにせよ、私は近い将来において人間の知能の価値が高まると予想しています。

Bill Maher は、AI が大学を「学生が AI を使って論文を書き、教授が AI で採点するという『大きな自己満足の輪』にしてしまった」と心配しており、学生たちは AI のファンではないことに気づいています。彼自身もそうではありません。彼は「AI は学習を助けることもあれば、学習を妨げることもある」という命題を支持していますが、誰もが学習しない方を選ぶと予想しています。そして彼はさらに進んで、この世代の使命は人間が AI に置き換えられないようにすることだと述べています。

Kelsey Piper は、AI が物語を生成する TeachTales という製品について、多くの理由から真の物語が持つ価値の多くが失われていると指摘しています。その理由には、ローカル設定や伝承の詳細が含まれていないこと、トーンや声の質感がないこと、先読みして計画を立てることができないために豊かな物語が構築できないことなどが挙げられます。この製品はまだ完成した段階には至っていません。

彼らが私たちの仕事を奪った

多くの熟練工は AI の影響で需要が高まっていますが、職業免許制度の改革不足という問題がこれをさらに悪化させています。

ソフトウェアエンジニアリングの雇用は今もなお増加しており、減少してはいませんが、Arvind Narayanan は AI がこの分野での雇用に全体的にやや悪影響を与えていると考えています。

Arvind Narayanan: この論文では、AI の能力がある一定の閾値に達すると大量解雇を引き起こすという物語を却下するだけの証拠が十分にあると主張します。規制障壁が非常に少ない分野であってもこれが真実であるならば、他のほとんどの職業はさらに保護されている可能性が高いです。

なぜそうなるのかについては、私たちがよく理解しています。ソフトウェア開発を含む多くの種類の知識労働を、「決定・実行・納品」というサンドイッチ構造として捉えることができます。

David Manheim: 「なぜ AI はソフトウェアエンジニアを置き換えていないか」 - これが明確に整理されているのは素晴らしいことです。

「…そして置き換えもしないでしょう」 - もしエージェント型 AI がさらに進化し続けるなら、なぜ意思決定や完成した製品の納出ができないと考えるのでしょうか?この予測はどのような根拠に基づいているのでしょうか?

David Manheim: 説明から予測への飛躍は、現在の完全な能力の欠如からの外挿であり、AI企業がこれらのことを行うシステムや自律型エージェントを開発しようとしているという事実を無視している。これらはオーリング問題だ!

たとえ現在 AI が正味の雇用削減を引き起こしていないことが真実であっても、将来も正味の雇用削減を引き起こさないとしても、あるいは大量解雇に必要な閾値をより低いものとして設定したとしても、「AI の能力が特定の閾値に達すると大規模な解雇を引き起こす」という物語を拒否することがどうして可能なのか、私は理解できない。

Arvind はここでは、特定の基準は決してクリアされないとし、広範なデジタルタスクは AI によって決して行えないと主張している。つまり、AI は依然として不十分なまま進歩しないと言っているのと同じだ。その点で幸運を祈る。

これまでのところ AI が原因とされる多くの解雇事例が実際には他の要因によるものであること、そして現在の AI による雇用喪失は採用失敗の形で現れていることは認める。しかし、それは現在に関する記述であり、未来に関するものではない。

NY Times にて、ハイブリッドな AI-人間労働力において誰が繁栄するか(在庫がある限り)について、重鎮たち(Acemoglu, Ball, Mollick, Shih, Wasik)によるラウンドテーブル討論。

タイラー・コーエンは、一般の人々がこれを期待していないにもかかわらず、AI は純粋に雇用を創出するものだと考えています。"もし私たちが豊かになれば、人々にとって次の最善の活動を見つけ出すだろう"という一般的な主張以外では、この議論を理解できず、 supposed particular job gains(想定される特定の雇用の増加)の規模が確実に非常に小さいものであると感じています。

コード行数やトークン使用量を測定することはできますが、それらに過度に依存しすぎるとすべてが破綻します。

roon (OpenAI): コード行数は人々が思っている以上に優れた指標であり、トークン使用量も同様に人々が思っている以上に優れた指標です。

パトリック・マッケンジー: 両方とも、一定の期間においてゼロまたは非ゼロとして観測可能であるという事実だけで、一般的に信じられているよりも優れた指標なのです。

(より過酷な真実:これが一部の人がこれらを好まない理由です。)

The Art of the Jailbreak(ジールブレイクの芸術)

面白い事例があります:マルウェア開発者がスパイウェアに核兵器や生物兵器に関するテキストを追加し、意図的に LLM の安全性拒否をトリガーさせて、スキャナーによる分析を回避しています。明白な対応策は、フィルタをトリガーするものはすべてマルウェアとして扱う必要があるということです。

参加しよう

⊢ Sequent Research は、ジェフリー・アーヴィングらによって設立された新しい組織で、スタッフの採用と資金調達を進めており、スーパーインテリジェンスのアライメント(調整)に関する研究者たちを集めています。

これは非常にエキサイティングであり、支援や参加を検討することを推奨します。

ジェフリー・アーヴィング:私たちは、新しい非営利の調整(アライメント)組織である⊢ シーケント・リサーチを立ち上げます。これは、英国 AI セキュリティ研究所(AISI)のアライメントチーム、タイメウス、およびその他の場所で研究を行っていた研究者たちを集め、スーパーインテリジェンスの調整方法について研究するものです。現在、採用中です!

詳細は本投稿をご覧ください。興味がある方はこちらからご連絡ください。

ジェフリー・アーヴィング:人工超知能(ASI)は数年内に開発される可能性があり、調整(アライメント)の取り組みは遅れています!少なくとも、AI 研究所における実証研究では、ASI の訓練前に調整がうまくいくという確信を得られることは unlikely です。

シーケントの目標は、より高い基準をクリアすることです:

  1. 私たちは、理論と実証的な賭け(すべて失敗する可能性もあります)のポートフォリオを通じて、より高い信頼性を目指します。
  2. 迅速な進展のために自動化に積極的に投資します。
  3. より良い研究方向性のフィルターを通じて、理論が自動化を強化します。

しかし、私はちょうど「自動調整はあなたが考えるよりも難しい」という論文を発表しました!自動調整は最善の計画ではありません。A be

原文を表示

A lot happened this week, including a great trip out to Lighthaven.

The main event, the one that matters, was the release of Claude Fable 5. The public now has its hands on a Mythos-class model, alongside strong safeguards.

As always with a new model, I take a few days to draw in reactions, try out the model and read the system card, before I offer my takes, other than to say this is an extremely strong model. Full coverage of Mythos begins tomorrow with the model card, which will include discussion of the controversy over model safeguards.

This post is instead about all the things that did not involve Claude Fable.

Due to the time crunch from Claude Fable, I am also postponing my coverage of Dario Amodei’s new essay, Policy on the AI Exponential, which I have not yet read.

Table of Contents

Language Models Offer Mundane Utility. Farming and on demand mini-books.

Language Models Don’t Offer Mundane Utility. Don’t skip your primary sources.

Huh, Upgrades. Google drops prices, Claude connector devs get a dashboard.

On Your Marks. Agents’ Last Exam and the need to correct for inference.

Choose Your Fighter. How much capability is enough?

Get My Agent On The Line. A goal can be optimized indefinitely.

Copyright Confrontation. Copyright has to adjust to different circumstances.

Serious Trouble. German court rules against Google AI Overviews.

Cyber Lack of Security. Opus finds a 4-year-old way to mint Z-Cash.

A Young Lady’s Illustrated Primer. Models adjust to your intelligence.

They Took Our Jobs. Attempts to smuggle in claims of what AI can never do.

The Art of the Jailbreak. Malware adds nuclear talk to lock out AI monitors.

Get Involved. Sequent Research is gearing up a large new AI safety push.

In Other AI News. Sriram Krishnan leaves the White House.

Hand Over The Money. Government may extort shares of AI companies.

Show Me the Money. OpenAI files to go public, SpaceX rents to Google.

Quiet Speculations. EU 2031 is a new scenario where Europe is left behind.

Quickly, There’s No Time. Anthropic on When AI Builds Itself.

Super Secret Evals. US government tells CAISI to stop publishing evals. Oh no.

The Quest for Sane Regulations. White House still on the moratorium war path.

New Draft Bill Who Dis. Obernolte-Trahan is a serious bill but looks weak.

Slow Down There Good Buddy. Or at least, make sure you have a break pedal.

Chip City. Jensen Huang chooses not to testify before Congress.

The Week in Audio. Cowen and Tabarrok, Rational Animations, Oprah.

People Just Say Things.

People Really Hate AI. Probabilities are not importance.

Rhetorical Innovation. Take the ASI pill, and notice when others don’t.

Aligning a Smarter Than Human Intelligence is Difficult. Say no to drugs.

Everyone Is Confused About Consciousness. Some do not realize this.

Cooperative Alignment. You now know who to follow to be more confused.

Let Claude Chat. The march of model deprecations continues.

The Lighter Side. That feeling when.

Language Models Offer Mundane Utility

Use a multi-agent setup to assemble ‘mini-books’ on demand about any topic.

AI is getting applied to farming. Farmers have skin in the game.

Language Models Don’t Offer Mundane Utility

Do you need to read the primary material first, before the summary or the AI version? When the details matter, either you have to find someone you really trust, or else yes you do need to read the primary material. Other times, deferring fully is safe. Another class is ‘use AI to determine if I need to read the source material.’

There are a lot more new apps in the agentic AI era, but if anything fewer apps with significant use, and fewer app reviews.

image
image

Adaptation, as Jen Zhu says, takes time, but this largely reflects quantity of app usage being zero sum. If apps get better, or there are ten times as many apps, I don’t go from 100 apps to 200 apps. I choose a (hopefully better) 100 apps.

Notion had to pull Claude access for about 12 hours due to availability errors, which then got misinterpreted by many as the models getting worse, due to use of the phrase ‘degraded performance.’

Huh, Upgrades

Claude adds observability dashboard for developers of connectors.

Google AI Plus plan drops from $8 to $5 per month, with doubled storage.

Obliteratus (the Pliny project to remove AI safeguards) is up to over 100 Hugging Face models.

Claude is now incorporated into Apple’s Foundation Models framework for multi-step reasoning, code generation and longer context.

On Your Marks

Dawn Song announces Agents’ Last Exam (ALE), where GPT-5.5 is in the lead. This seems like a good addition to our evaluation suite.

image
image

Dawn Song: ALE is built from real work, not synthetic tasks.

Every task is derived from a real project that a human expert previously completed, and converted into a verifiable evaluation with objective grading.

No vibes. No human judges. Fully reproducible.

ALE spans 55 non-physical occupations, grounded in the O*NET / SOC 2018, the U.S. federal occupation taxonomy.

Built with 300+ experts from 100+ institutions across science, engineering, medicine, law, finance, education, and many other fields.

image
image

Dawn Song: In ALE, Fable 5 joins GPT-5.5 and Composer 2.5 in the same overall performance cluster. But performance is only half the story.

Cost per task:

→ Fable 5: ~$15.70

→ GPT-5.5: ~$3.80

→ Composer 2.5: ~$1.33

At current pricing, Fable 5 delivers similar performance while costing roughly 4–12× more per completed task.

Dawn notes that different models excel at different agent tasks, so if you have a key repeatable task you should check many options, and exact scoring depends on choice of the set of tasks.

OpenAI’s Noam Brown reminds us, because the issue keeps not being addressed, that benchmark performance increasingly often scales with compute allocations, and that improved models are often about ‘gets to a high level faster,’ so any score requires the context of how much compute was required.

He quotes me complaining about Gemini 3 DeepThink showing dramatic benchmark improvements but not providing any safety explanation whatsoever, and says the deeper issue is failure to account for test time compute during evaluations. I basically agree, that the proper safety evaluation amount of compute is ‘all of it’ until you can’t much benefit from more of it, using the best available scaffold. I’ve been saying for a while that you’re testing for what the model can do under ideal conditions, and this is a major weakness of the model cards in practice.

Mostly though I don’t think we see this level of straight line extending that far out, although ‘capability index’ is not exactly a well-labeled axis, and asymptotes are common:

image
image

Noam Brown: Specific Recommendations:

Concretely, I recommend the following to the AI community:

AI labs should publish benchmark performance of newly released models with tokens, cost, or time on an x-axis. At a minimum, labs should report the inference budget used to achieve a scalar benchmark result.

Benchmarks should track inference usage on leaderboards, or have an explicit token/cost/time budget. Many benchmarks have already shifted in this direction, but it is not yet standard practice.

Preparedness Frameworks and Responsible Scaling Policies should explicitly account for inference compute when determining whether a model crosses a safety threshold. Additionally, evaluations should estimate capabilities at multiple inference budgets, including projections from smaller-budget runs with stated uncertainty.​

I endorse this. I also endorse that if you did account for what DeepThink levels of compute can do in your initial analysis, and then later you release DeepThink, you do need a new model card - it represents a substantial advance from where you set expectations and where you evaluated the safety of your model. So you need to do that over again.

Choose Your Fighter

For most given tasks, returns to capability is a sigmoid. There is a level of AI capability that is ‘required’ for any given task. Below that level, you can’t do the task, or the AI is little net help. Then there’s another level beyond which you get diminishing returns to improvement, where you really are ‘good enough.’ These are both impacted by scaffolding and skill, but only up to a point.

So yes, as capabilities improve, there is a push by some to move into the cheapest model that is ‘good enough,’ or even the cheapest that is ‘required,’ especially if that can come with self-hosting. At a sufficiently low end that is plausibly DeepSeek v4, but the defaulting to DeepSeek could be the legacy of the DeepSeek moment rather than the result of a considered check of available options. Try a bunch of models.

The bulk of spend and spending growth continues to be using ‘the good stuff’ at the high end, for good reason. In theory you can do better by carefully picking the right tool for each job, and certainly you need to keep your teams from ignoring compute costs, but mostly trying to carefully route tasks to save money is a trap, even if you do a decent job of it.

The American models are far ahead but it is a key world fact that many don’t get this.

Lisan al Gaib: the "narrow capability gap" in question

let's put this to rest please

I can't hear the coping anymore [lists a bunch of benchmarks on difficult tasks where the Chinese models get absolutely smoked.]

If anything, the Chinese models are further behind than benchmarks indicate.

Dean W. Ball: You’d be shocked by how many people in think tanks/academia/government/“strategic classes,” including in the U.S., are convinced that Chinese models are now “good enough” and leading the world in adoption. Meanwhile, the reality I see is a fairly wide, and still widening, gap.

I find it so interesting how persistently unable the strategic classes of free society are to analyze AI well. So many keep getting stuck in these basins of delusion. I was at a conference where it was not just asserted but taken for granted that Chinese models have dominant global inference market share.

The 2024/early 25 version of the delusion was “mode collapse/data wall” (even after reasoning models!), then it was “AI is plateauing and a bubble” for most of 2025, now it’s “Chinese OSS is good enough.”

The share of people in the strategic classes who think this is gradually declining, but it is still sufficiently common that you can attend a prestigious conference and encounter a room principally filled with basin-dwellers.

Dean goes on to speculate this is largely because no one in DC believes that capitalism, profit maximization or the market could be winning against China and its ‘industrial strategy’ and brilliant strategic planning. Whereas actually the free market approach is superior and is winning, and what we have to do to stay head is get out of its way. That is distinct from the whole ‘also we need to find a way to not die’ issue.

Those elsewhere also really ‘want’ for various reasons to find Chinese models catching up, and keep making the claim they are catching up even though they aren’t.

Get My Agent On The Line

If you use features like Codex’s /goal without well specified targets, yes, the result will often be quite a lot of wasted optimization of some total bullshit. Something about giving AIs maximalist goals and that being a bad idea.

Copyright Confrontation

Shruti gives us a good way to think about the problem of copyright in the AI era. Copyright and other IP including patents are needed and useful when the first copy or figuring out how to do it is expensive, and enables great surplus via others copying. We need to compensate people for the expensive step that opens up the value. With AI, what becomes the expensive step?

Shruti Rajagopalan: The old bargain paid for the first copy when the second was cheap. The new one must pay for the years that teach a person what is worth making, now that making itself gets cheaper.

We can do that by protecting copies of the idea, or otherwise ensuring credit, as ‘the first copy requires idea generation’ is not so different from ‘the first copy requires a bunch of work.’ So this seems like a suggestion that the idea does need to be protected, even if the work becomes somewhat distinct.

Serious Trouble

This is only a temporary injunction from a regional court, and given the implications chances are very high that an off ramp is found. But if it isn’t, this essentially bans AI Overview in Germany, and potentially chatbots run into quite serious trouble as well.

Techmeme: A German court rules that Google is directly liable for what AI Overviews say after AI Overviews falsely tied two publishers to shady business practices ( @maba_xr / The Decoder)

Corey Quinn: “We built a robot that lies, so obviously we’re gonna stuff it front and center of the website we’ve spent thirty years making a societal source of truth” reaches an unsurprising result.

Cyber Lack of Security

Opus 4.8 discovered a way to mint Z-Cash (ZEC) out of thin air. The bug had existed for 4 years, and we will never know if it was exploited during that time. Z-cash devs were able to patch without revealing the situation.

A Young Lady’s Illustrated Primer

Models that are given context will inevitably learn and adjust for your intelligence and skill level, both in specific areas and in general. Teaching is a special case of this where it is clearly very good to be able to meet you where you are. In other areas, it is not clear if the stupider user would want to be treated as stupider, but either way I too expect human intelligence to increase in value for the near term.

Bill Maher is worried that AI has made college ‘one big circle-jerk where students use AI to write papers and professors use AI to grade them,’ and notices the students are very much not AI fans and he is not either. He subscribes to the ‘AI can help you learn or not learn’ thesis but expects everyone to choose not learning. He goes all the way, and says the mission of this generation is to ensure that humans are not replaced by AIs.

Kelsey Piper notes that TeachTales, which has AI generate stories, ends up dropping a lot of the value of real stories for many reasons, including that it doesn’t include the local setting lore and details, and that it doesn’t have tone of voice and it doesn’t have rich stories because it can’t plan ahead, and so on. The product is not ‘there’ yet.

They Took Our Jobs

Many skilled trades are in high demand due to AI, with the problem made worse by a lack of occupational licensing reform.

Software engineering jobs continue to increase for now rather than decrease, although Arvind Narayanan thinks AI has net hurt employment here a bit.

Arvind Narayanan: In this essay, we argue that there is enough evidence to reject the narrative that once AI capabilities reach a certain threshold, it will cause mass layoffs. Given that this is true even in a sector with very few regulatory barriers, most other professions are likely to be even more cushioned.

We also have a good understanding of why this is the case. We can think of many kinds of knowledge work, including software development, as a “decide-execute-deliver sandwich”.

David Manheim: "Why AI hasn’t replaced software engineers" - Great to see this laid out clearly.

"...and won’t" - Why should we think agentic AI won't be able to make decisions or deliver completed products, if it continues to advance? On what basis is this prediction being made?

David Manheim: The jump from explanation to prediction is extrapolating from a current lack of complete capacity, dismissing the fact that AI companies are actively trying to develop systems and autonomous agents that will do these things. These are o-ring problems!

Even if it were true that AI currently is not causing net layoffs, and even if it indeed will not cause net layoffs in the future, or you could set a lower bar on the required threshold for mass layoffs, I do not see how it would be possible to ‘reject the narrative that once AI capabilities reach a certain threshold it will cause mass layoffs.’

Arvind here is instead asserting that certain bars will never be cleared, and wide ranges of digital tasks can never be done by AI. Which is the same as saying AI will remain insufficiently advanced. Good luck with that.

I do buy that many cases of layoffs supposedly due to AI so far are actually due largely to other things, and that most AI job loss for now comes in the form of failure to hire. But that’s a statement about the present, not the future.

A round table of heavy hitters (Acemoglu, Ball, Mollick, Shih and Wasik) in the NY Times on who will thrive in the hybrid AI-Human workforce (while supplies last).

Tyler Cowen thinks AI is a net job creator despite zero regular people expecting this. Other than a generic ‘if we are wealthy we will find the next best thing for people to do’ I do not understand the argument here, and find the magnitude of supposed particular job gains reliably very small.

Measure lines of code and token use, but if you rely on it too much everything breaks.

roon (OpenAI): lines of code is a better metric than people think it is. token use is a better metric than people think it is

Patrick McKenzie: Both of them are better metrics than they are popularly believed to be *just* off of the fact that they can be observed to be zero or non-zero over an interval.

(The blacker pill: and this is why some people do not like them.)

The Art of the Jailbreak

Here is a fun one: Malware developers add nuclear and biological weapons text to their spyware, so intentionally trigger LLM safety refusals and avoid being analyzed by scanners. The obvious response is that you have to treat anything that triggers the filters as if it is malware.

Get Involved

⊢ Sequent Research is a new organization from Geoffrey Irving and others that is staffing up and fundraising, bringing together researchers on how to align superintelligence.

This seems exciting and I encourage you to consider supporting or getting involved.

Geoffrey Irving: We are starting a new, nonprofit alignment organization, ⊢ Sequent Research, bringing together researchers previously on UK AISI’s Alignment Team, Timaeus, and elsewhere to research how to align superintelligence. We are hiring!

Full post here. Express interest here.

Geoffrey Irving: Artificial superintelligence (ASI) may be developed in the next few years, and alignment is not on track! At a minimum, empirical research at AI labs is unlikely to deliver confidence, before training ASI, that alignment will go well.

Sequent’s goal is to clear a higher bar:

  1. We are aiming at higher confidence via a portfolio of theory and empirics bets (which could all fail!)
  2. We’ll invest heavily in automation for fast progress
  3. Theory boosts automation, via better filters for good research directions

But I just published “Automated alignment is harder than you think”! Automated alignment is not the best plan! A be

この記事をシェア

関連記事

MarkTechPost★52026年6月13日 17:15

米国政府の命令により、Anthropic が Claude Fable 5 と Mythos 5 の利用を停止

Anthropic は、2026年6月12日に発令された米国政府の輸出管理指令に基づき、国家安全保障上の理由から、Claude Fable 5 および Claude Mythos 5 という2つの最新モデルの利用を全顧客に対して即時停止した。

Latent Space★52026年6月13日 13:30

[AINews] ファブルとミソス、公式にリリース不可と判断される

Anthropic は、公開からわずか3日後の「Fable」と「Mythos」について、国家レベルのサイバーセキュリティリスクとなる可能性のある脱獄(ジャイルブレイク)が確認されたため、全顧客向けに即時リリースを撤回した。

Simon Willison Blog★52026年6月13日 10:01

米国政府による Fable 5 および Mythos 5 のアクセス停止指令に関する声明

Simon Willison は、米国政府が国家安全保障を理由に発行した輸出管理指令により、Anthropic が Fable 5 と Mythos 5 へのすべての外国籍ユーザーのアクセスを停止せざるを得なくなったと発表した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む