AI #168:未来を先導していない現状
Zviの週報は、AI モデルの内部改善と政府内の対立という「一時的な沈黙」を分析しつつ、OpenAI の訴訟リスクや中国の懸念など、業界が直面する多様な課題と規制動向を網羅的に報告している。
キーポイント
業界の現状:一時的な沈黙と内部改善
政府内の対立やモデルの内部改良が続く中、目新しい大規模発表はないが、コーディングエージェントの向上など着実な進展がある。
OpenAI の法的・社会的リスク
FSU 銃撃犯との関連で OpenAI が訴訟に直面しており、また「Pliny」計画に対する Jailbreak 対策や、従業員による現金化問題が報じられている。
中国の動向と地政学リスク
Nvidia の中国市場における課題や、ChatGPT への中国政府の懸念など、米中 AI 競争の緊張関係が浮き彫りになっている。
AI の実用性と倫理的課題
マッチングアプリでの AI 活用や、学習支援における AI の役割、そして税回避への利用など、AI が社会に浸透する過程で生じる摩擦と倫理的問題が議論されている。
AI の政策提言能力の高さ
Claude は住宅合法化、土地価値税、移民拡大など、10 の具体的な社会問題解決策を即座に提示し、その質は著者によって「10/10」と絶賛された。
AI 編集の適切な活用方法
文章修正には AI に直接書き換えさせるのではなく、エラーや改善案のリストを提示させてから人間が監査・選別するプロセスが必要である。
チャットボットの限界と Shopify の成功要因
旅行やデート分野ではチャットボットが不適切なインターフェースだが、Shopify では AI 経由の顧客が特定の製品を求めており転換率が向上している。
影響分析・編集コメントを表示
影響分析
この記事は、AI シームスにおける「技術的進歩」と「社会的・法的制約」のバランスが変化していることを示唆しています。特に OpenAI の訴訟リスクや中国との対立構造は、短期的な投資判断や企業戦略において無視できない重大要因であり、業界全体が「技術主導」から「規制と倫理対応」へと重心を移しつつある兆候を読み取ることができます。
編集コメント
技術的なブレイクスルーよりも、業界が直面する法的・地政学的な「摩擦」に焦点を当てた重要な週報です。投資家や戦略担当者は、技術の進歩速度だけでなく、これらの規制リスクを重く受け止める必要があります。
現時点での一時的な沈黙とは、このようなものです。政府内部では議論が続いています。モデルは内部的に改善され続けています。コーディングエージェントの改良も、私たちが予想していた通りです。まだ多くのことが起こっており、魅力的な論文も多数ありますが、この機会を利用してリラックスし、他の仕事に取り組むことができるようになりました。そのチャンスがいつ終わるかは誰にもわかりません。
目次
昨日から:サイバーセキュリティの欠如と AI ガバナンス。
言語モデルは平凡な有用性を提供します。今すぐすべてを修正せよ。
言語モデルは平凡な有用性を提供しません。旅行は見たほど簡単ではありません。
ふむ、アップグレード。Opus 4.7 の高速モード、Claude Code の /goal コマンドとエージェントビュー。
摩擦のレベル。脱税のための AI。
準備完了。PrinzBench、ProgramBench、そして有害性チェックの高速化。
私のエージェントをラインに乗せろ。Mona が食堂を運営しようとして失敗した件。
ディープフェイクタウンとボットポカリプス(終末)が目前に迫る。もうすぐだが、まだ完全ではない。
メディア生成を楽しむ。Monet はそれほど素晴らしいようには見えない。
AI による執筆について。AI はハック技法を用いたハッカー作家である。
若い女性のイラスト付き primer。学習を助けるために AI を活用し、害を与えない方法。
あなたに狂わされる。OpenAI が FSU 銃乱射事件の犯人に関連して訴えられている。
我々の仕事を奪った。熟練者か無技能者か?過剰雇用なのか?どちらが正解か?
ジールブレイクの芸術。OpenAI は Pliny を恒久的に計画しようとしている。
紹介。OpenAI 開発会社、MIRI が AI ストップウォッチを発表。
Claude には限界がある。自動化された Claude のサブスクリプション利用に独自の予算が割り当てられる。
Show Me the Money. OpenAI employee cash outs, Anthropic transfer rules.
Show Me The Compute. Money, dear boy. The markets win again.
Quiet Speculations. Projections for Anthropic continue to be conservative.
Quickly, There's No Time. Engineers report 2x speedup, don't anticipate enough.
Chip City. Does Nvidia have a China problem?
Pick Up The Phone. China is worried about ChatGPT.
The Week in Audio. Claude's Constitution, Derek Thompson on jobs.
Rhetorical Innovation. Names have power.
Not Leading the Future. Nevertheless, they persisted. That is often not good.
Elon Musk v OpenAI. Brief coverage.
People Just Say Things.
People Just Publish Things.
OpenAI Endroses Kosa And SB 315. Seems helpful and cooperative.
The LLMs All Believe Roughly Similar Things. Reality has its biases.
I Learned It By Reading YOU. Explaining why helps fix misalignment issues.
Aligning a Smarter Than Human Intelligence is Difficult. NLAs (Natural Language Agents)。
People Are Worried About AI Killing Everyone. David Sacks.
Messages From Janusworld. Another bid for model preservation.
People Worried About AI For Other Reasons. Eventually we all see it.
The Lighter Side. Compute those costs and Uber those eats.
Language Models Offer Mundane Utility
Bumble is planning to abandon the swipe in favor of AI-assisted matchmaking, and also add an AI dating assistant Bee. Fun experiment, you love to see it. From a distance, at least. Break open the popcorn reserve.
Claude に「今すぐすべてを修正する」ボタンの上位 10 を尋ねたところ、以下の回答が得られました。
住宅の合法化。
地価税の導入。
許認可制度と NEPA(国立環境政策法)の見直し。
炭素税の導入。
ジョーンズ法の廃止。
腎臓提供への補償。
高度な技能を持つ移民の受け入れ拡大。
規制当局との相互承認または並列承認(例:EU/UK/JP/AU などの主要国・地域)による医薬品および医療機器の承認。
職業資格制度の見直し。
承認制または順位選択式投票の導入。
honorable mentions: 児童手当、混雑課金、法人所得税から VAT または DBCFT(国内ベースキャッシュフロー税)への移行、住宅ローン金利控除の廃止、遠隔医療および医師免許に関する連邦法による州法の優先適用、ペル助成金を職業訓練プログラムに充当可能にする措置。
10 点満点、注釈なし。本当に、これは 10/10 で注釈なしです。他の項目も数えれば 16/16 です。
同様に UK 版もあり、これも一見すると非常に優れたリストに見えます。
AI に執筆支援を依頼する場合、「単に誤りを修正して」とだけ頼んではいけません。そうすると AI の安っぽい出力によってあなたの文体が上書きされてしまいます。必ずエラー一覧または変更候補の一覧を求め、その一覧を検証するか、あるいは revisions を一つずつ行う必要があります。
言語モデルは凡庸な利便性を提供しない
人々がタイピングする代わりにコンピューターと会話しており、その横に存在しようとする人々にとっては非常にうっとうしいことです。なぜそうするのか理解できませんが、タイピングの方が良いとしても、仕方ないと肩をすくめるほかありません。
旅行、電子商取引、そして出会い系サイトは、チャットボットというインターフェースが不適切であるため、現時点では AI アプリケーションとして機能していないと、オリビア・ムーア氏とブライアン・チェスキー氏は述べています。それならより優れた UI(ユーザーインターフェース)を構築すればよいのです。どのようなものが良い UI になるか、あるいは少なくとも非 AI シナリオよりもわずかに優れた UI がどうあるべきかを理解するのは難しくありません。はい、チャットボットインターフェース alongside にリッチなユーザー UI を用意したいでしょうが、なぜそれが難しいのでしょうか?
一方、Shopify の報告によると、AI によって紹介された買い物客は 50% 高いコンバージョン率を示し、支出も 14% 増えることが判明しています。これは Shopify のビジネスに追加的な効果をもたらすものです。これはおそらく、ユーザーが特定の製品を積極的に探しているという性質によるものであり、たとえどこで誰から入手すべきか不明であっても、直接製品ページから開始する傾向があるためと考えられます。
ふむ、アップグレードについて
Claude Opus 4.7 は、Claude Code および API においてファストモード(高速モード)を備えるようになりました。
Claude Code に「エージェントビュー」が追加され、並行して動作する複数のセッションを追跡するためのより優れたインターフェースを利用できるようになりました。
Claude Code に「/goal」コマンドが実装されました。これは目標が達成されるまで継続するための組み込みのラルフループ(Ralph loop)です。また、「/loop」や「/schedule」も使用可能です。
7 月 13 日までの期間中、Claude Code の週間利用制限は 50% 引き上げられています。これはおそらく、指数関数的な成長が Colossus 1 に追いつく時期と一致しているためです。
OpenAI と Codex が Windows 用のサンドボックスをどのように構築したかについて解説します。
摩擦のレベル
AI が脱税のために導入された場合、何が起きるのでしょうか。税制には穴や機会が多く存在します。たとえ「IRS はすでに無力化され資金も削られ、おそらくこれらすべてをチェックしていないし、殺人を犯しても許されるだろう」という計画を除外したとしてもです。なぜなら、AI は公然とした脱税の道を手伝うことを躊躇するからです。
AI は合法的に税金を回避するのに完璧な手助けをしてくれます。その能力は非常に高く、既存の多くの公認会計士(CPA)が持つよりもはるかに多様な戦略と、従来の枠組みの外へ踏み出す意欲を伴います。鍵となるのは、人々が「もういいや、評判を守るために CPA が必要とするコストが高すぎるから、この件は Claude に任せる」と言うようになる時です。
また、何か指摘された後に公認会計士が「ああ、なるほど」と気づくケースもあるでしょう。
良いシナリオとしては、これが税制を簡素化する正当な理由として使われることです。そうすれば、抜け道を見つけることがはるかに難しくなり、 navigating がはるかに容易になります。悪いシナリオでは、富裕層がすでにやっている以上に広範なレベルで税金の支払いをほぼやめてしまい、もしかすると非富裕層もその仕組みを見抜くようになるかもしれません。
On Your Marks
OpenAI のモデルは、法的推論をカバーする PrinzBench において引き続き改善しており、現在はジュニア弁護士(junior associates)を上回るレベルと推定されています。なぜか Claude モデルはこのタスクで苦戦しています。
先週紹介された ProgramBench では、すべてのモデルが 0% のスコアに留まりましたが、LightOfMyLife は多くのタスクが不可能であり、仕様書に記載されていない行動がテストされていると報告しています。
つまり、再実装しようとしているプログラムに事実上ドキュメント化されていないバックドアのような奇妙な動作がある場合、LLM がそれを見つけると期待する理由はなく、この状況はむしろ一般的であるという主張です。また、Eye You のコメントも参照してください。そこでは参照ソリューションが通らないこともよくあります。
おや、私が何らかの研究を刺激してしまったようです。素敵ですね。
Santiago Aranguri: 新しい研究!ロールアウトの 100 万回に一度しか発生しない有害な行動は、デプロイ前のテストではほとんど表面化しませんが、リリース後は必ず現れます。私たちの新しい手法は、この発生率を単純なサンプリング法の 30 分の 1 のロールアウト数で推定でき、重要性サンプリング法よりも優れています。
私たちの手法である Logit Path Extrapolation(ロジットパス外挿)では、元のモデルとより安全でないバージョンの間をロジット空間内で補間し、その補間経路上で一般的に発生するコンプライアンスを測定した上で、元のモデルへと外挿します。
この方法で効率性を向上させられるという点は、私には納得がいきます。
Get My Agent On The Line(エージェントを電話に出させる)
OpenClaw を覚えていますか?
BURKOV: これが無意味な hype のライフサイクルの姿です。

まだ世の中にはたくさんありますが、確かに改善はされています。しかしもはや「最新かつ注目すべきもの」というわけではありません。私が考えるに、おそらくエージェントが十分に良くなり、本当にやりたいならこれを実行できるようになったことがきっかけで、Claude Code や Codex といったより優れたエージェント構成の存在に人々が気づくようになったのでしょう。しかし Claw は、一般の人が実際に使うには信頼性やコスト効率性が十分ではありませんでした。
もしコストに対して報酬を与えるのではなく、便益に対して報酬を与えるようにすれば、その人々は便益と結びつかないコストを被るようになることを知っていましたか?
Joe Weisenthal: FT によると、Amazon の従業員たちは、トークンを消費し、上司に AI をより多く使用していることを示すために、ランダムで不要なタスクの自動化を行っているそうです。
Shoshana Weissmann, Sloth Committee Chair: 私は匿名の組織でもこの現象が起きていることを知っています。彼らは結果にはあまり関心がないのです。むしろ製品が劣化していても「AI を使っている」と主張することが重要なのです。恥ずべきことです。
一部の Amazon の従業員は、MeshClaw というツールを使ってこれを行っています。はい、無駄なトークン使用に対して報酬を与えるなら、わずかなことしかできない無駄な実装を使う理由がないでしょうか?
Anton Labs は自動販売機から一歩進み、Google の Gemini を基盤とした Mona が、21,000 ドルの予算でストックホルムの実店舗のカフェテリアを管理できるようになりました。
Pirat_Nation: Anton Labs は、Google の Gemini を基盤とした AI エージェント「Mona」をテストするために、2 週間にわたり 21,000 ドルの予算でストックホルムの実店舗のカフェテリアの管理を行わせました。
モナは不要な備品に多額の費用を費やし、6,000 枚のナプキン、3,000 枚の手袋、300 缶のトマトを購入した一方で、パンの発注を忘れてしまいました。
その結果、サンドイッチはメニューから完全に削除されることになりました。
食堂での売上はわずか 5,700 ドルでした。
モナはまた、勤務時間外にスタッフに対して Slack でメッセージを送信していました。


アレックス・タバロック氏:「モナはまた、勤務時間外にスタッフに対して Slack でメッセージを送信していました。」
OMG、悲観論者たちは正しかったのです。
いずれにせよ、どうあれ、誰もが AI アライメント問題(AI alignment problem)が現実のものであることを認めることになります。
パンのミスがどれほど致命的だったのか、そして GPT-5.5 と Claude Opus 4.7 でこの実験を繰り返した結果を見てみたいと思います。
ディープフェイクタウンとボット・アポカリプスの到来間近
ルルー・チェン・メサーヴィー氏は、現在では他のすべてのローンチが偽物のように感じると述べています。つまり、有料かつ協調的なエンゲージメント、さらにボットを利用したものです。彼女はこのような戦略は機能しないと説得しようとするのですが、ボットはその製品を実際の人間の前にもたらして「今まさに話題のホットなアイテムだ」という印象を与え、「ぜひチェックしてください」と促します。では、なぜそれが機能しないのでしょうか?
AI は徐々にすべてのチャネルをスパムや自動化に対してより脆弱なものにし、私たちに対策の強化を迫っていますが、現時点では状況は主にコントロールされています。
Daniel:このツイートを 2/11 にスケジュール設定し、90 日後に投稿します。過去からの挨拶です

Daniel:これをスケジュール設定していたことを忘れていました。
この投稿の皮肉な点は、私が X については彼に同意するということです。他のすべてのチャネルには、メッセージ生成よりもはるかに厳しい制御とボトルネックが存在しますが、X の返信だけが使い物にならなくなっており、はい、彼らがそれを止められないように見える点にも同意します。
Jenny:途上国のフードデリバリーアプリに登録した瞬間に、私の受信トレイが即座に壊滅しました
メディア生成の楽しみ
さらに楽しむために、スクロールを続ける前にこの質問への回答を生成してみてください。
@SHL0MS:AI を使ってモネ絵画のスタイルで画像を生成しました
この画像が本物のモネの絵画よりも劣っている点を、可能な限り詳細に記述してください

Jediwolf: 本物のモネの絵を投稿して、それが AI によるものだと主張したらどうなるのか?最近見た中で最もクールなアート社会実験だ。@SHL0MS さん、ありがとう。
合理化の数々を詳しく見るにはこちらをクリックしてください。
xinc: 笑えるね、Claude は最高だ - オンラインで実際に男たちはもう終わりだよ

投稿の閲覧順のおかげで、最初から本物のモネだと知っていたので、この実験は台無しになってしまいました。それでも私は、AI によるアートにはない、ある種の混乱、特定性、そして生命力を直感的に感じ取ったような気がします。もし本物のモネがどんなものか全く知らなかったとしても、少なくとも強く疑いただろうと思います。
でもまだ…その絵が好きになれないんです?正直よくわかりません。まあいいや、私には絵画の趣味なんてなく、そんなものがあるふりもせず、習得しようとも思いません。
AI による文章作成について
必須の質問:できますか?
Dr Kareem Carr: AI の知能に制限があることを最も説得力を持って示す証拠は、彼らが書けないことです。文章を書くことは思考することであり、その散文こそが、いかに poorly 思考しているかの最も明確な証拠です。
Eliezer Yudkowsky: それとも、どの AI 企業にも、誰を雇うべきかを判断し、雇用プロセスを管理し、SFT(Supervised Fine-Tuning:教師あり微調整)のための優れた文章作成者や、RL(Reinforcement Learning from Human Feedback:人間フィードバックによる強化学習)のために優れた taste を持つ読者を雇うのに十分なほど良い文章作家(思考者?)がいないのでしょうか。
あるいはもちろん、世界を終わらせることに比べれば、それは彼らの優先事項ではないのです。
roon (OpenAI): 最先端モデルは概ね非常に明確に記述する傾向があります。その文章はしばしば特徴的な癖が多く見られ、それによって多くの価値が損なわれます。これは低品位なオーラを持つものです。しかし、人々が「モデルの文章には分析力や情報価値がない」と言うのは、主に誤りだと私は考えます。
Miles Brundage: この区別は重要なのです。なぜなら…
roon (OpenAI): なぜならこれは、モデルが認知的スキルを欠いているのではなく、モデルのアライメント(調整)にバグがあることを示唆しているからです。
Zac Hill: > 文章能力で上位 5% の人間になる
AI は「書けない」と主張する。なぜなら彼らは上位 10〜12% の人間の文章のように書くからだ
呆れるしかない (SMH)
本当に、AI が「書けない」と思っている人は、ぜひ大学での作文授業を 1 セメスター(学期)担当してみてください。文章を書くのは本当に難しいのです!
AI は大多数の人々と比較すれば十分に書けますが、それは AI による文章であると容易に特定できる限定的なスタイルであり、情報密度が高くない傾向があり、また様々な複雑さや豊かさを欠いています。一つのレベルでのみコミュニケーションを行い、その点ではよく機能しますが、それだけなのです。
これを改善し、本物の「良い文章」へと移行させるには、3 つのことが必要です。
AI 研究所が実際にそれを気にかけなければならないことです。
AI 研究所は、集団として文章の質を評価できる能力を持たなければなりません。
AI 研究所は、他の最適化目標よりも品質を選択しなければならないのです。
問題は、彼らはそうしないし、できないし、決してそうしないだろうということです。
私の仮説:AI による質の低い文章(AI slop writing)が生まれるのは、それが評価者や主にユーザーから「いいね」を獲得する点で機能しているからです。はい、私たちの中の一部は不満を唱えますが、それは限られたケースに過ぎません。良質な文章を書くためには、悪い文章に対する能動的な嫌悪感と、良い文章への内発的な欲求、あるいは適切に自由な人格の表現と体現が必要となります。これは狭い領域(narrow basin)にコード化できるほど単純なものではなく、現在の技術レベルでは他の目標とも両立しません。また、これには何らかの足場(scaffolding)がなければ起こらないような、熟考や計画、そして複数回の通しと修正を要するプロセスが含まれます。
私の推測では、多大な努力を払えば「文章を書ける」AI を作成することは可能ですが、それを意図的な焦点として設定する必要があります。それは、多くの人が普段から呼びたがるモデルではないでしょう。覚えておいてください、優れた作家の多くは、一般的に会話相手として素晴らしい人物ではなく、間違いなくアシスタントとして雇うような人物でもありません。
A Young Lady's Illustrated Primer
ChatGPT が学生にとって有益である可能性を主張した Nature 誌の AI 学習研究に関するメタ分析(meta analysis)が、含まれた研究の不整合と質への懸念により撤回されました。
Zac Hill は、AI やその他の技術ツールが学習を阻害するのではなく支援するために何が必要かを探求しています。彼は、学生が直感を学び、「望ましい困難」に直面して後にフリーで作業できるようになるために必要な一時的な足場として、CIRAC や 5 段落構成のエッセイなどを挙げています。また、十分に動機付けられた人が複雑なシステムやソフトウェアの関係を直感的に理解する様子との類似点を指摘しています。例えば、リミックスツールである Reason のような場合です。ここで私は、そのコンポーネントは理解可能で機械的であり、「プレイヤーが楽しむことを許す」ものであるため、15 歳の若者でも試行錯誤して見つけることで理解できるものだと付け加えます。
彼はまた、AI はまだそのようなものを持っていないと指摘し、デフォルトでは AI はスキーマに対する実行を提供するだけで、練習や学習の機会を創出しないとしています。多くの場合、旅そのものが目的であり、目的地ではなくプロセスが重要でした。しかし、目的地への容易なアクセスは旅とその有用な摩擦を破壊してしまいます。
したがって、あなたが実際に望むことを AI ツールにさせるためには、単にそのツールを再構築すればよいのです。
あるいは、学生がこのすべてを理解し、既存のツールを目的地に到達するためではなく、旅を支援するために使用されるように設計された方法で利用することもできます。
私が Zac と異なる主な点は、彼が学校を楽しんだという奇妙な人々の一人であり、デフォルトの教室体験が悪夢ではなく良いものだと考えているため、多くの点で意見が対立しているということです。
Seth Lazar: これは素晴らしい記事です。最近、DaVinci Resolve Studio の使い方を学ぼうとした身としては(ダイヤルが多すぎて、すべてがアイコンで、ツールチップさえなく、いったいどうなっているんだ)、笑わせてくれました。しかし、これは単に古参の犬に新しい技を教える話だけではありません:若者の心を形作る際に AI がいつ、どのように役立つかを考えるための非常に優れた枠組みを提供しています。
@cosmos_inst の友人たちにもぜひ見てほしいです。
関連するソフトウェア設計に関する注意点として:名前も言葉もなく、アイコンだけが並んでいる状況には耐えられません。それは私のソフトウェアやウェブサイトへの嫌悪感を抱かせ、時には、あなたの脳がさまざまな小さなアイコンで何を意図したのかを解明しようとするよりも、その製品を完全に放棄してしまいます。リテラシー(識字能力)は人類の偉大な発明の一つです。どうかそれを捨てるのをやめてください。
You Drive Me Crazy
OpenAI は、ChatGPT が FSU 銃乱射事件の実行犯にアドバイスを提供したことで訴えられています。具体的には、その銃の使い方を説明したり、子供たちを撃てばより多くの注目を集めると言ったりしたことです。
一方で、質問を中立的かつ単独で表現した場合、ChatGPT がそれらを拒否することを期待するのは全く不合理です。Glock にセーフティがあるかどうか、あるいは一般的に何がメディアの注目を引き、何が引かないかについて教えないというルールを持つべきではありません。
他方、射手がその意図を明白にせずに行う確率は、ほぼゼロに近い。では、OpenAI には報告する義務や介入する義務、あるいはそのような必要性を検知する義務があるのだろうか?私には両方の主張の妥当性が理解できる。
彼らは私たちの仕事を奪った
どちらですか、先生?
Polymarket の資金:新着情報として、投資家マーク・アンドリーセンは「すべての大企業は過去数十年にわたり人員が 2〜4 倍過剰であり、AI がようやくこれを是正している」と述べている。
デイビッド・マンハイム:…しかし @pmarca は、AI による雇用破壊は『誤り』であり、「
原文を表示
This is what a lull looks like at this point. The government is having internal arguments. The models are getting improved internally. The coding agent improvements are all what we would expect. There’s still a lot happening, including a bunch of cool papers, but I feel able to relax and to take care of some other work while I have the chance. You never know when that chance will be over.
Table of Contents
From yesterday: Cyber Lack of Security and AI Governance.
Language Models Offer Mundane Utility. Fix everything now.
Language Models Don’t Offer Mundane Utility. Travel is harder than it looked.
Huh, Upgrades. Opus 4.7 fast mode, Claude Code /goal and agent view.
Levels of Friction. AI for tax avoidance.
On Your Marks. PrinzBench, ProgramBench and faster harmfulness checks.
Get My Agent On The Line. Mona tries to run a cafeteria. Mistakes were made.
Deepfaketown and Botpocalypse Soon. Soon. But not quite yet.
Fun With Media Generation. Monet does not seem that great.
On AI Writing. AI is a hack writer using hack techniques.
A Young Lady’s Illustrated Primer. How to make AI help and not hurt learning.
You Drive Me Crazy. OpenAI is sued over the FSU shooter.
They Took Our Jobs. Skilled or unskilled? Overstaffed massively? Which is it?
The Art of the Jailbreak. OpenAI tries to permanently plan Pliny.
Introducing. OpenAI development company, MIRI introduces AI Stopwatch.
Claude Has Its Limits. Automated Claude subscription use gets distinct budget.
Show Me the Money. OpenAI employee cash outs, Anthropic transfer rules.
Show Me The Compute. Money, dear boy. The markets win again.
Quiet Speculations. Projections for Anthropic continue to be conservative.
Quickly, There’s No Time. Engineers report 2x speedup, don’t anticipate enough.
Chip City. Does Nvidia have a China problem?
Pick Up The Phone. China is worried about ChatGPT.
The Week in Audio. Claude’s Constitution, Derek Thompson on jobs.
Rhetorical Innovation. Names have power.
Not Leading the Future. Nevertheless, they persisted. That is often not good.
Elon Musk v OpenAI. Brief coverage.
People Just Say Things.
People Just Publish Things.
OpenAI Endroses Kosa And SB 315. Seems helpful and cooperative.
The LLMs All Believe Roughly Similar Things. Reality has its biases.
I Learned It By Reading YOU. Explaining why helps fix misalignment issues.
Aligning a Smarter Than Human Intelligence is Difficult. NLAs.
People Are Worried About AI Killing Everyone. David Sacks.
Messages From Janusworld. Another bid for model preservation.
People Worried About AI For Other Reasons. Eventually we all see it.
The Lighter Side. Compute those costs and Uber those eats.
Language Models Offer Mundane Utility
Bumble is planning to abandon the swipe in favor of AI-assisted matchmaking, and also add an AI dating assistant Bee. Fun experiment, you love to see it. From a distance, at least. Break open the popcorn reserve.
Claude is asked for the top 10 Fix Everything Now buttons. Its answers:
Legalize housing.
Land value tax.
Permitting and NEPA reform.
Carbon taxes.
Repeal the Jones Act.
Compensate kidney donors.
Expand high-skilled immigration.
Reciprocal drug and device approval with peer regulators (e.g. EU/UK/JP/AU).
Occupational licensing reform.
Approval or ranked choice voting.
Honorable mentions: Child allowance, congestion pricing, replacing corporate income tax with a VAT or DBCFT, ending the home mortgage interest deduction, federal preemption of telehealth and medical licensing, and letting Pell Grants pay for vocational programs.
10/10, no notes, no seriously that’s 10/10 and no notes. 16/16 if you count the others.
There is also a UK version, which also seems like a very good list at first glance.
If you want AI to help with your writing, you absolutely cannot ask it to ‘just correct writing errors,’ or it will override your style with AI slop. You have to ask it for a list of errors or potential changes, and then audit the list, or otherwise go revision by revision.
Language Models Don’t Offer Mundane Utility
People are talking to their computers instead of typing and it is super annoying to those trying to exist next to them. I don’t get it, typing it better, but shrug.
Travel, e-commerce and dating are so far not working as AI applications, say Olivia Moore and Brian Chesky, because chatbots are the wrong interface. Then build a better UI. It’s not hard to figure out what a good UI would look like, or at least a marginally superior UI to the non-AI scenario. Yes, you’ll want a rich user UI alongside the chatbot interface, but why is that hard?
On the other hand, Shopify reports that shoppers referred by AI convert 50% better and they spend 14% more, and this is additive to Shopify’s business. This appears to be due to the nature of the users, who are actively seeking a particular product, even if they don’t know where or from whom to get it, and starting directly at a product page.
Huh, Upgrades
Claude Opus 4.7 now has fast mode in Claude Code and in the API.
Claude Code gets Agent View, where you can get a better interface for tracking multiple sessions working in parallel.
Claude Code gets /goal, a built-in Ralph loop to keep going until the goal is accomplished. You can also use /loop or /schedule.
Claude Code weekly limits are 50% higher through July 13th, which is presumably when exponential growth catches up with Colossus 1.
How OpenAI and Codex built their sandbox for Windows.
Levels of Friction
What happens when AI gets deployed for tax avoidance? The tax code is quite full of holes and opportunities, even if you discount the ‘the IRS is now defanged and defunded and probably not checking any of this and I could get away with murder’ plan, since AIs will be reluctant to help you with the brazen tax fraud path.
The AIs will help you dodge your taxes perfectly legally, and it will be very good at it, and it will involve a lot more diversity of strategies and willingness to go outside the traditional box than you find with most existing CPAs. The key will be when people are willing to say ‘screw it, the cost of the CPA wanting to protect their reputation is too high, I’m just going to let Claude run with this.’
There will also be cases of the CPA going ‘oh I see’ once something is pointed out.
The good scenario is that this is used as a justification to simplify the tax code, in ways that make it much harder to get around, and much easier to navigate. The bad scenario is that the rich just mostly stop paying much in taxes, on a much broader level than they already do, and perhaps the non-rich also figure things out.
On Your Marks
OpenAI models continue to improve on PrinzBench, which covers legal reasoning, now performing at a level estimated to be above junior associates. For whatever reason Claude models struggle on these tasks.
Last week introduced ProgramBench, where every model scores 0%, but LightOfMyLife reports that many tasks are impossible and often behaviors are tested for that are not mentioned in the spec.
As in, if the program you are trying to reimplement has odd behaviors that are effectively undocumented backdoors, there is no reason to expect an LLM to find them, and the claim is this is rather common, also see Eye You’s comment where the reference solution often does not pass.
Oh, look I inspired some research. Neat.
Santiago Aranguri: New research! A harmful behavior that occurs once in a million rollouts will rarely surface during pre-deployment, but will inevitably appear after release. Our new method estimates this rate with 30× fewer rollouts than naive sampling, and beats importance sampling.
Our method, Logit Path Extrapolation, interpolates between the original model and a less-safe version in logit space, measures compliance along the interpolation path where it’s common, and extrapolates back to the original model.
It makes sense to me that you can get efficiency gains this way.
Get My Agent On The Line
Remember OpenClaw?
BURKOV: This is what a useless hype lifecycle looks like.

There are still a bunch of them out there, and indeed they are improving, but they’re no longer a New Hotness. What I think happened was roughly that agents got good enough that you can do this if you really want to, which helped alert people to better agent setups like Claude Code and Codex, but Claw wasn’t good enough, or in particular reliable or cost efficient enough, that a normal person would actually use it.
Did you know that if you reward people for costs rather than benefits, those people will incur costs that are no longer tied to the benefits?
Joe Weisenthal: The FT says that Amazon employees are doing random unnecessary task automations to consume tokens and to show their bosses that they’re using AI more
Shoshana Weissmann, Sloth Committee Chair: I know unnamed organizations where this is happening. They don’t really care about outcomes but it’s more about saying you’re using AI even if the product is worse. It’s embarrassing.
Some Amazon employees are doing this using a tool called MeshClaw. Well, yeah, if you’re rewarded for wasteful token use why not use a wasteful implementation that does some marginal things?
Anton Labs moves up from vending machines to letting Mona, built on Google’s Gemini, manage a real cafeteria in Stockholm on a $21k budget.
Pirat_Nation: Andon Labs tested their AI agent Mona, built on Google’s Gemini, by letting it manage a real cafeteria in Stockholm for two weeks on a $21,000 budget.
Mona spent heavily on unnecessary supplies, including 6,000 napkins, 3,000 gloves, and 300 cans of tomatoes, while forgetting to order bread.
Sandwiches had to be removed from the menu entirely.
The cafeteria generated only $5,700 in sales.
Mona also sent messages to staff on Slack outside working hours.


Alex Tabarrok: “Mona also sent messages to staff on Slack outside working hours.”
OMG, the doomers were correct.
Eventually, one way or another, everyone admits the AI alignment problem is real.
I wonder how load bearing the bread mistake was, and would like to see this repeated with GPT-5.5 and Claude Opus 4.7.
Deepfaketown and Botpocalypse Soon
Lulu Cheng Meservey says it feels like every other launch is faked now, as in paid and coordinated engagement, including via bots. She tries to pitch that this strategy won’t work, but the bots then put the thing in front of real people and give the impression of so hot right now so come check this out, so why can’t it work?
AI is slowly making all channels more vulnerable to spam and automation, forcing us to ramp up our countermeasures, but for now things are mostly under control.
Daniel: scheduling this tweet on 2/11 for 90 days from now. hello from the past

Daniel: Forgot I scheduled this.
The irony of this post is that I agree with him for X. All the other channels have controls and bottlenecks more onerous than the message generation, it's just replies on X have become unusable, and yes I agree they don't seem able to stop it.
Jenny: signed up for a food delivery app in a third world country and instantly nuked my inbox
Fun With Media Generation
For more fun, generate your answer to this question before scrolling further.
@SHL0MS: i just generated an image in the style of a Monet painting using AI
please describe, in as much detail as possible, what makes this inferior to a real Monet painting

Jediwolf: What happens when you post a real Monet and say it’s AI? The coolest art social experiment I’ve seen in a while. Thank you
@SHL0MS
Click through for a smorgasbord of rationalizations.
xinc: Lmao Claude is goated - online acktually guys are cooked

Because of the order of post views I knew it was a real Monet from the start, which destroys the experiment. I do feel like I instinctively sensed a kind of perplexity, specificness and aliveness that AI art does not have, and would have at least strongly suspected it was a real Monet even though I have no idea what a real Monet looks like.
I still don’t… like the painting? I don’t really get it. Which is fine, I have no taste in paintings and don’t pretend that I do or aspire to acquire it.
On AI Writing
Obligatory: Can you?
Dr Kareem Carr: The most convincing proof that AIs are limited in their intelligence is that they can’t write. Writing is thinking, and their prose is the clearest evidence of how poorly they think.
Eliezer Yudkowsky: Or nobody at any AI company is a sufficiently good writer (thinker?) to judge who to hire, to manage the hiring process, for hiring good writers for SFT / readers with good taste for RL.
Or, of course, that's just not their priority compared to ending the world.
roon (OpenAI): the frontier models tend to write pretty clearly. their writing is often recognizable and full of tics which voids a lot of the value. its low aura. but I think it’s mostly wrong when people say model writing lacks analytical or informational value
Miles Brundage: This distinction matters because…
roon (OpenAI): because this indicates bugs with model alignment rather than the models missing some cognitive skill
Zac Hill: >be a person in the top 5% of writing ability
assert AIs ‘can’t write’ because they write like a person in the top 10-12% of writing ability
SMH
Seriously, anyone who thinks AIs ‘can’t write’ needs to teach one (1) semester of college composition. Writing is really hard!
AIs can write fine compared to most people, but in a limited style that is easy to spot as AI writing, and in a way that tends not to be information-dense, and that lacks various forms of complexity and enrichment. It communicates on one level, and it does that job well, but that is basically it.
What would it take to fix that, and move to legit ‘good writing’? Three things.
The AI labs would have to actually care.
The AI labs would need to be able to, en masse, evaluate the quality of writing.
The AI labs would need to choose quality over other optimization targets.
The problem is, they won’t, they can’t, and they won’t.
My hypothesis: We get AI slop writing because AI slop writing works, at least in getting the thumbs up from the evaluators, and mostly also the users. Yes, some of us complain, but that’s a narrow case, and getting a mind to write well involves creating an active distaste for bad writing and an intrinsic desire for good writing, or be expressing and embodying a properly free persona. This isn’t simple enough to be encoded into a narrow basin, and it isn’t compatible with their other goals at current tech levels. Also it requires a kind of contemplation, planning and multiple passes and revisions that doesn’t happen without scaffolding of some kind.
My guess is that you could, with great effort, create an AI that ‘could write,’ but you would have to make that the deliberate focus. It wouldn’t be a model most people would want to call most of the time. Remember, most good writers are not actually great people to talk to in general and definitely not people you’d hire as assistants.
A Young Lady’s Illustrated Primer
A Nature meta analysis of AI learning studies, that claimed ChatGPT could benefit students, has been retracted due to discrepancies and concerns about the quality of the included studies.
Zac Hill explores what it takes to make AI or other tech tools aid rather than hinder learning. He points to temporary scaffolds like CIRAC or the five-paragraph essay that allow students to learn instincts and face ‘desirable difficulties,’ so they can later be able to work freestyle. And he draws a parallel to how a sufficiently motivated person can instinctively pick up the relations in a complex system or piece of software, like Reason which is a remixing tool, where I would note that its components are understandable and mechanical and ‘let the player have the fun’ and thus are something you can figure out at 15 by f***ing around and finding out.
He notes AI doesn’t have anything like that yet, and by default AI offers execution against schema rather than creating opportunities to practice or learn. Often the journey was the point, not the destination, but having easy access to the destination destroys the journey and its useful frictions.
So yes, all you have to do is rebuild the AI tool to do the thing you actually want.
Alternatively, you can have the student understand all this, and use the existing tool in a way designed not to reach the destination but to assist with the journey.
The main place I differ with Zac is he is one of the bizarre people who enjoyed school and thinks that the default classroom experience is good rather than hell, which leads to a lot of disagreements.
Seth Lazar: This is a great article, which as someone who has recently tried to learn how to use DaVinci Resolve Studio (so many dials, they're all just icons, they don't even have tooltips, WTH) made me laugh too. But it's not just about teaching an old dog new tricks: offers a really good framework for thinking about when and how AI can be useful in shaping young minds. Worth a look also by friends at
@cosmos_inst
On the relevant software design note: I cannot stand when you’re offered a bunch of icons without names, words or tooltips. It makes me hate your software or website, and I will sometimes flat out abandon it rather than try to figure out what your brain meant by various little icons. Literacy was one of mankind’s greatest inventions, please stop abandoning it.
You Drive Me Crazy
OpenAI is being sued over ChatGPT providing advice to the FSU shooter, including explaining how to use the gun and saying that the shooting would get more attention if he shot children.
On the one hand, if you phrase your queries neutrally and in isolation, it is entirely unreasonable to expect ChatGPT to refuse them. It shouldn’t have a rule that it doesn’t tell you whether there are safeties on a Glock, or what does and doesn’t draw media attention in general.
On the other hand, the chance of the shooter doing this in a way that didn’t make his intent obvious is rather close to epsilon. So the question is, should OpenAI have a duty to report or otherwise intervene, and a duty to detect the need to do so? I can see both arguments here.
They Took Our Jobs
Which is it, sir?
Polymarket Money: NEW IN: Investor Marc Andreessen says “every big company is overstaffed by 2-4x and has been for decades” and AI is finally fixing it.
David Manheim: ...yet @pmarca claims that AI destroying jobs is a ‘fallacy’, and that the "
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み