AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
One Useful Thing·2025年9月12日 05:37·約15分で読める

ウィザードとの協業について

#LLM#Black Box AI#Human-AI Collaboration#GPT-5 Pro#NotebookLM
TL;DR

著者は、AI との関わり方が「共同作業(パートナー)」から「魔法使いへの祈り(出力受容者)」へと転換しつつあり、特に GPT-5 Pro のような高度なモデルではプロセスの不透明さが顕在化していると指摘する。

AI深層分析2026年5月3日 00:09
4
重要/ 5段階
深度40%
5
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

AI との関わり方のパラダイムシフト

従来の AI を「共同知性(Co-intelligence)」として修正・指導しながら協働する関係から、AI が自律的に成果を創出する「魔法使い」として扱い、人間は受動的な観客や祈る者へと変化する傾向が指摘されている。

2

プロセスの不透明性と出力の質

最新の AI モデルは複雑なタスクでも驚くほど正確で洗練された出力を生成するが、その判断プロセスや根拠がブラックボックス化しており、人間がプロセスに介入できなくなる。

3

GPT-5 Pro の実証事例

著者が NotebookLM や GPT-5 Pro を使用した実験では、事実関係の正確性は高いものの、AI がどのように結論に至ったか不明であり、人間の編集権限が制限される状況が確認された。

4

AI の高度な分析能力と発見

GPT-5 Pro は学術論文の手法を批判し、コードを実行してモンテカルロ解析を行うなど独自の検証を行い、人間が気づかなかった数値の誤りを発見した。

5

AI によるツール操作とシミュレーション

Claude 4.1 Opus はファイル処理能力を活用し、既存の財務モデルを基に新しいビジネス(チーズショップ)向けの分析課題を迅速に実行した。

6

AI への信頼と「ウィザード問題」

AI の結果は正確であることが多いが、その内部プロセスや完全な妥当性を人間が完全に検証できないため、盲目的な信頼には注意が必要である。

7

AI エージェントの自律的な計画と実行能力

新しいAIシステムは目標達成のために自らステップを計画・実行するエージェントであり、予期せぬエラーが発生した場合にも人間に指示されることなく自己修正を行う。

影響分析・編集コメントを表示

影響分析

この記事は、生成 AI の進化に伴う人間と機械の関係性の根本的な変化を鋭く捉えており、今後の AI リテラシーやガバナンスのあり方に対する重要な警鐘となっている。特に「ブラックボックス化された高度な出力」が日常化する中で、ユーザーがその信頼性をどう検証し、責任を持って利用するかが組織全体で問われることになる。

編集コメント

「共同作業」から「魔法使いへの祈り」へという比喩は、現在の AI 進化の速度とブラックボックス化の問題を非常に鮮やかに表現しており、業界関係者にとって重要な視点を提供する。

私の著書『Co-Intelligence』では、人々が AI とどのように協働すべきかという方法を提示しました。それは驚くべきことではありませんが、AI を「共知能」として扱うというものです。チャットボットとチームを組むことで、人間は AI を一種のインターンや同僚として活用し、その誤りを修正し、成果を検証し、アイデアを共同で開発し、正しい方向へと導くことができます。ここ数週間の間に、私は共知能の重要性は今なお変わらないが、AI の性質が別の方向へ向き始めていると考えるようになりました。私たちはパートナーシップから観客へ、協働から創造へと移行しつつあります。

この変化を説明する良い方法は、私が著書を書いた以来の世界で何が起こったのかについて AI に解説を求めることです。私は私の著書と、約 140 の「One Useful Thing」の投稿(ついでに言うと、これほど多くの投稿を書き溜めたことに自分でも驚いています!)を NotebookLM に読み込ませ、AI の世界で何が起きたかについての動画を作成するための基本的なプロンプトと共に、新しいビデオ概要オプションを選択しました。

数分後、これが得られました。そして、これはかなり良い出来です。私の著書が出版されて以来の世界の動向について最新情報を入手する価値があるほどに、よくできています。

しかし、AI はどのようにしてその要点を選んだのでしょうか?私は知りませんが、それらは非常に的確でした。どのスライドを使用するかをどう決定したのでしょうか?これも私にはわかりませんが、それもかなり的を射ていました(ただし画像は依然としてやや弱点のようで、約束されたオッターは表示されませんでした)。それは正しいのでしょうか?それが何か確認すべきことのように思えました。

そこで、私はその動画を何度も確認し、すべての事実をチェックしました。MMLU スコアに関するデータや神経外科手術試験データにおける AI のパフォーマンスの結果など、数値はすべて正確でした(私がいつその資料を引用したのかさえも確信が持てません)。私の唯一の本当の問題点は、ボストン・コンサルティング・グループの研究において「ジャギッド・フロンティア」という用語を導入した際、私は複数の共著者の一人であったことを明記すべきだったという点です。また、AI が言ったようにすべてを言うべきではなかったでしょう(少し大げさで、私の本はまだ時代遅れではありませんが)、実質的な誤りはありませんでした。

このプロセスは、新しい波の AI において典型的であると考えます。複雑なタスクの範囲が増えるにつれて、あいまいな要求に対して驚くほど洗練された出力が得られますが、その過程に自分が関与することはできません。AI がどのような選択をしたのか、またすべてのことが完全に正しいかどうかを確認することもできません。私たちはプロセスを形成する共同作業者から、結果を受け取る請願者へと移行しています。これは共知能(co-intelligence)と協力することから、魔法使い(wizard)と協力することに変わる転換です。魔法は行われますが、その結果をどう扱えばよいか常にわかるとは限りません。このパターン——印象的な出力、不透明なプロセス——は研究タスクにおいてさらに顕著になります。

魔法を求める

現在、GPT-5 Pro を上回る魔法のような存在感を放つ AI モデルはありません。ただし、このモデルは有料ユーザーのみが利用可能です。GPT-5 Pro は、正直言って驚くべき成果をいくつか達成できる能力を持っています。例えば、私はある学術論文を読み込み、「この論文の手法を批判し、より良い手法を見つけて適用せよ」という指示を与えました。これは単なる論文ではなく、私のジョブマーケットペーパー(就職市場用論文)でした。つまり、私が学者として初めて手がけた主要な作品です。執筆には1年以上かかり、最終的に主要な学術誌で査読を経て出版されるまでに、私の分野における最も優秀な人々の多くが慎重に読み込みました。

9分40秒後、私は非常に詳細な批判を受け取りました。これは単なる編集上の批評ではなく、GPT-5 Pro は実際にコードを用いて独自の実験を実行し、私の結果を検証しました。その中にはモンテカルロ分析の実施や、統計モデルにおける固定効果の再解釈も含まれていました。その結果、多くの提案がなされました(幸いにも「論文の主要な主張は検証に耐える」と結論付けてくれました)が、特に目立った提案がありました。それは以前から見過ごされていた小さな誤りを見つけ出したことです。この誤りは、2 つの表に含まれる異なる 2 つの数値セットに関連するものでした。これらは私の論文で明示的に記述されていない方法で相互に関連付けられていました。AI はその些細な誤りを発見しましたが、これまで誰も気づいていませんでした。

image
image

再び、私はウィザードの問題に直面しました:これは正しいのか?結果を確認すると確かにそうでしたが、AI がどのようにしてこの問題に気づいたのか、また他の主張したことが記述通りに行われたのかについては依然として全くわかりません。しかし、GPT-5 Pro の分析には感銘を受けました。そのため現在、私はあらゆる種類の課題を大小問わずモデルに投げかけています。「ガートナーのハイプサイクルは実在するのか?」「国勢調査データは大企業における AI 利用が減少していることを示しているのか?」といった問いに対し、GPT-5 Pro に尋ねれば正しい答えが得られるはずです。そう思っています。まだ誤りを見つけてはいませんが、それは誤りが存在しないという意味ではありません。もちろん、AI が何らかの良質な回答を提供できないタスクも数多くあります。ウィザードについて誰がわかるでしょうか?

これが間もなくより広範な業務に適用されるようになる様子を見るために、もう一つの高度な AI である Claude 4.1 Opus を考えてみましょう。このモデルは最近、ファイルとの連携機能を獲得しました。特に Excel において卓越した能力を示すため、私がよく知る Excel ファイルで難易度の高い課題を与えてみました。私の起業家教育クラスで使用している演習の一つに、不確実性に対処する方法を教える lessons として、小さな机製造企業の財務モデルを分析するものがあります。私は Claude に古いマルチタブ形式の Excel ファイルを与え、全体の演習の目的を維持しつつ、新しいビジネス(チーズ専門店)向けにこのファイルを更新するように依頼しました。

image
image

その指示一つだけで、AI は授業計画書と古いスプレッドシート(英:spreadsheets)を読み込み、数式もそのままに、チーズショップに適した新しいスプレッドシートを作成しました。数分後、たった一つのプロンプト(英:prompt)で、私のコンピュータには完全にデータが書き換えられつつも、重要な教訓を伝えるという点では変わらない、新たな変換済みのスプレッドシートがダウンロードされていました。

image
image

左側が元の文書、右側が Claude が生成したものです。

再び言いますが、この「魔法使い」は自らの技の秘密を明かさなかったため、私は結果を慎重に確認する必要がありました。私が目にした限りでは、その成果は非常に良好で、新しい文脈においても教訓が正しく保持されていました。ただし、数式やビジネスモデル(英:business modelling)の一部には、私なら異なるアプローチをとる箇所もいくつか見受けられました(例えば、年間の営業日数をもう少し減らしたでしょう)。しかし、それは本質的な誤りというよりは、単なる意見の相違のように感じられました。

Claude がどこまでできるか興味深く思っていたのと、誰もが「AI は PowerPoint を作れるのか」と尋ねてくるので、「素晴らしい、このビジネスのための良い PowerPoint を作って」とプロンプトを入力し、以下の結果を得ました。

image
image

これはピッチデッキのかなり堅実なスタートであり、重大な誤りはありませんが、すぐに使える状態ではありません。これは AI の不揃いな最前線(フロンティア)を強調しています:AI は特定の分野では非常に優れていますが、経験がないと予測が難しい方法で他の分野では劣っています。私は、拡大し続ける AI 能力の領域内で例を示してきましたが、それは AI がすべてのことを等しく容易にできるという意味ではありません。しかし、本稿での私の焦点は、AI 能力の拡大範囲そのものよりも、私たちが AI と持つ関係性の変化にあります。

ウィザード(魔法使い)の問題

これらの新しい AI システムは本質的にエージェントであり、与えられた目標に向かって自律的に計画し行動する AI です。Claude にスプレッドシートの変更を依頼した際、それは元のスプレッドシートを読み込むところから始まり、新しいものを作成するコードを書くに至るまでの手順を計画して実行しました。しかし、予期せぬエラーにも適応し、私からの指示なしに 2 回もスプレッドシートを修正し、回答を複数回検証しました。これらの手順を選択したのは私ではなく、実際には、強化学習によって駆動される新しい世代のエージェントにおいては、誰も手順を選択しません。モデル自身が問題を解決するための独自の手法を学習するのです。

image
image

スプレッドシートを変更するために Claude が報告した手順の順序

介入できないだけでなく、AI システムが実際に何をしたのかを完全に確信することもできません。Claude が報告した手順は単なる作業の要約に過ぎず、GPT-5 Pro はさらに少ない情報しか提供せず、NotebookLM は動画作成のプロセスについてほとんど洞察を与えてくれません。仮に手順が見えたとしても、コーディングから起業まで多岐にわたる分野の専門家である必要があり、AI が何をしているのかを本当に理解するためにはそうしなければなりません。もちろん、正確性の問題もあります。すべての事実を確認せずに、AI の正確性をどうやって判断できるでしょうか?また、事実が正しくても、それらをどのように提示し、枠組みを作るかについて私が異なる判断を下したかもしれません。しかし、私は何もできません。なぜなら、魔法使いたちは私の助けを望んでおらず、自分たちさえ説明できない秘密裏の方法で活動しているからです。

この難しさは、結果が良い点にあります。非常に良いのです。私はこの記事で AI に与えた 3 つのタスクにおける専門家ですが、これらの出力に事実上の誤りは一切見つけられませんでした。ただし、いくつかの細かなフォーマットの誤りや、私が異なる選択をしたであろう箇所はありました。もちろん、すべての詳細を確認しない限り、文書が完全に誤りがないかどうかを確約することはできません。場合によっては、自分で作業を行うよりも遥かに少ない時間で確認できることもあれば、逆に非常に多くの時間がかかることもあります。また、AI の仕事があまりにも洗練されているため、仮に確認を試みても不可能なケースさえあります。

そしてそれは、私たちが十分に議論していない別のリスクを示唆しています:私たちは何かを魔法使い(ウィザード)に任せるたびに、自分自身の専門性を育む機会を失い、その魔法使いの仕事の評価に必要な判断力を構築するチャンスを逃しているのです。

しかし、私は不可避な点に戻ります。結果は良いのです。少なくともこれらのケースにおいては。これらは、数時間(あるいは私の論文の再分析の場合のようにそれ以上)働いた大学院生から期待される成果と同等ですが、私が得たのは数分後でした。

これが魔法使いの問題です:私たちは何か魔法のようなものを手に入れますが、同時に、魔法使いやその助手ではなく、単なる観客へと成り下がってしまいます。共知能(co-intelligence)モデルでは、私たちは導き、修正し、協力しました。しかし現在、ますます頻繁に、私たちはプロンプトを入力し、待ち、そして確認する…もし可能であれば、そうしています。

では、ウィザードをどう扱うべきでしょうか。私は新しいリテラシーを育成する必要があると考えます。まず第一に、いつウィザードを召喚すべきか、いつ AI を共知能(co-intelligence)として協力させるべきか、あるいは全く使用しないべきかを学ぶことです。AI はまだ完璧ではなく、依然として苦手とする分野では人間の方が成功することが多いです。しかし、AI が有用となるタスクの数は増え続けており、そのような場面では、必要な行き来を伴う共知能(co-intelligence)が、機械単独よりも優れていることがよくあります。それでもなお、ウィザードを召喚し、その結果を信頼することが最善となる局面は、ますます増えています。

第二に、プロセスではなく出力の鑑賞家になる必要があります。AI が提供する出力の中から選別・編集するだけでなく、AI と十分に協力して、それが成功する時と失敗する時の直感を養うことが必要です。何が正しく、何が外れており、何を知らないことによるリスクがある価値あるものかを判断することを学ばなければなりません。これは教育にとって難しい課題を生み出します。AI 自体が習熟を妨げる状況下で、未熟な分野における作業を検証する人材をどう育成するかという問題です。このギャップに対処する方法を見出すことは、ますます緊急性を増しています。

最後に、仮定的信頼(provisional trust)を受け入れることです。ウィザード・モデルとは、「十分良好」なものとの協働をより頻繁に行うことを意味します。これは基準を下げるからではなく、完全な検証がもはや不可能になっているからです。問われるべきは「これが完全に正しいか?」ではなく、「この目的に対して十分に有用か?」です。

私たちはすでに技術的な魔法を信頼することに慣れています。経路を理解せずに GPS を使ったり、アルゴリズムに自分の見るものを選ばせたりするたびに、私たちは異なる種類の魔術師を信頼していることになります。しかし、決定的な違いがあります。GPS が失敗した場合は、行き止まりに到達した瞬間にすぐに気づきます。Netflix が間違った映画を推薦しても、単に見なければよいだけです。しかし、AI が私の研究を分析したりスプレッドシートを変換したりする場合には、その精度が上がるほど、それが間違っているかどうかを知ることは難しくなります。AI の魔術師と協力することのパラドックスは、能力と不透明性が同時に高まることです。私たちは、これらのツールを最も検証できないタスクのために必要としています。これは昔話から得られる古い教訓です:魔法が優れるほど、その神秘性は深まります。私たちは引き続き魔術師たちを呼び寄せ、できる範囲で確認し、呪文が機能することを願うでしょう。1 週分の分析にわずか 9 分しかかからないのに、なぜそうしないでしょうか?魔術師の時代へようこそ。

購読する

共有する

image
image
原文を表示

In my book, Co-Intelligence, I outlined a way that people could work with AI, which was, rather unsurprisingly, as a co-intelligence. Teamed with a chatbot, humans could use AI as a sort of intern or co-worker, correcting its errors, checking its work, co-developing ideas, and guiding it in the right direction. Over the past few weeks, I have come to believe that co-intelligence is still important but that the nature of AI is starting to point in a different direction. We're moving from partners to audience, from collaboration to conjuring.

A good way to illustrate this change is to ask an AI to explain what has happened since I wrote the book. I fed my book and all 140 or so One Useful Thing posts (incidentally, I can’t believe I have written that many posts!) into NotebookLM and chose the new video overview option with a basic prompt to make a video about what has happened in the world of AI.

A few minutes later, I got this. And it is pretty good. Good enough that I think it is worth watching to get an update on what has happened since my book was written.

But how did the AI pick the points it made? I don’t know, but they were pretty good. How did it decide on the slides to use? I don’t know, but they were also pretty on target (though images remain a bit of a weak point, as it didn’t show me the promised otter). Was it right? That seemed like something I should check.

So, I went through the video several times, checking all the facts. It got all the numbers right, including the data on MMLU scores and the results of AI performance on the neurosurgery exam data (I am not even sure when I cited that material). My only real issue was that it should have noted that I was one of several co-authors in our study of Boston Consulting Group that also introduced the term “jagged frontier.” Also, I wouldn’t have said everything the way the AI did (it was a little bombastic, and my book is not out-of-date yet!), but there were no substantive errors.

I think this process is typical of the new wave of AI, for an increasing range of complex tasks, you get an amazing and sophisticated output in response to a vague request, but you have no part in the process. You don’t know how the AI made the choices it made, nor can you confirm that everything is completely correct. We're shifting from being collaborators who shape the process to being supplicants who receive the output. It is a transition from working with a co-intelligence to working with a wizard. Magic gets done, but we don’t always know what to do with the results. This pattern — impressive output, opaque process — becomes even more pronounced with research tasks.

Asking for Magic

Right now, no AI model feels more like a wizard than GPT-5 Pro, which is only accessible to paying users. GPT-5 Pro is capable of some frankly amazing feats. For example, I gave it an academic paper to read with the instructions “critique the methods of this paper, figure out better methods and apply them.” This was not just any paper, it was my job market paper, which means my first major work as an academic. It took me over a year to write and was read carefully by many of the brightest people in my field before finally being peer reviewed and published in a major journal.

Nine minutes and forty seconds later, I had a very detailed critique. This wasn’t just editorial criticism, GPT-5 Pro apparently ran its own experiments using code to verify my results, including doing Monte Carlo analysis and re-interpreting the fixed effects in my statistical models. It had many suggestions as a result (though it fortunately concluded that “the headline claim [of my paper] survives scrutiny”), but one stood out. It found a small error, previously unnoticed. The error involved two different sets of numbers in two tables that were linked in ways I did not explicitly spell out in my paper. The AI found the minor error, no one ever had before.

image
image

Again, I was left with the wizard problem: was this right? I checked through the results, and found that it was, but I still have no idea of what the AI did to discover this problem, nor whether the other things it claimed to have done happened as described. But I was impressed by GPT-5 Pro’s analysis, which is why I now throw all sorts of problems, big and small at the model: Is the Gartner hype cycle real? Did census data show AI use declining at large firms? Just ask GPT-5 Pro and get the right answer. I think. I haven’t found an error yet, but that doesn’t mean there aren’t any. And, of course, there are many other tasks that the AI would fail to deliver any sort of good answer for. Who knows with wizards?

To see how this might soon apply to work more broadly, consider another advanced AI, Claude 4.1 Opus, which recently gained the ability to work with files. It is especially talented at Excel, so I gave it a hard challenge on an Excel file I knew well. There is an exercise I used in my entrepreneurship classes that involves analyzing the financial model of a small desk manufacturing business as a lesson about how to plan despite uncertainty. I gave Claude the old, multi-tab Excel file, and asked the AI to update it for a new business - a cheese shop - while still maintaining the goal of the overall exercise.

image
image

With just that instruction, it read the lesson plan and the old spreadsheets, including their formulas, and created a new one, updating all of the information to be appropriate for a cheese shop. A few minutes later, with just the one prompt, I had a new, transformed spreadsheet downloaded on my computer, one that had entirely new data while still communicating the key lesson.

image
image

The original document on the left, what Claude gave me on the right

Again, the wizard didn’t tell me the secret to its tricks, so I had to check the results over carefully. From what I saw, they seemed very good, preserving the lessons in a new context. I did spot a few issues in the formula and business modelling that I would do differently (I would have had fewer business days per year, for example), but that felt more like a difference of opinion than a substantive error.

Curious to see how far Claude could go, and since everyone always asks me whether AI can do PowerPoint, I also prompted: “great, now make a good PowerPoint for this business” and got the following result.

image
image

This is a pretty solid start to a pitch deck, and one without any major errors, but it also isn’t ready-to-go. This emphasizes the jagged frontier of AI: it is very good at some things and worse at others in ways that are hard to predict without experience. I have been showing you examples within the ever-expanding frontier of AI abilities, but that doesn’t mean that AI can do everything with equal ease. But my focus is less on the expanding range of AI ability in this post, than about our changing relationships with AIs.

The Problems with Wizards

These new AI systems are essentially agents, AI that can plan and act autonomously toward given goals. When I asked Claude to change my spreadsheet, it planned out steps and executed them, from reading the original spreadsheet to coding up a new one. But it also adjusted to unexpected errors, twice fixing the spreadsheet (without me asking) and verifying its answers multiple times. I didn’t get to select these steps, in fact, in the new wave of agents powered by reinforcement learning, no one selects the steps, the models learn their own approach to solving problems.

image
image

The steps Claude reported it went through in order to change the spreadsheet

Not only can I not intervene, I also cannot be entirely sure what the AI system actually did. The steps that Claude reported are mere summaries of its work, GPT-5 Pro provides even less information, while NotebookLM gives you almost no insights at all into its process in creating a video. Even if I could see the steps, however, I would need to be an expert in many fields - from coding to entrepreneurship - to really have a sense of what the AI was doing. And then, of course, there is the question of accuracy. How can I tell if the AI is accurate without checking every fact? And even if the facts are right, maybe I would have made a different judgement about how to present or frame them. But I can’t do anything, because wizards don’t want my help and work in secretive ways that even they can’t explain.

The hard thing about this is that the results are good. Very good. I am an expert in the three tasks I gave AI in this post, and I did not see any factual errors in any of these outputs, though there were some minor formatting errors and choices I would have made differently. Of course, I can’t actually tell you if the documents are error-free without checking every detail. Sometimes that takes far less time than doing the work yourself, sometimes it takes a lot more. Sometimes the AI’s work is so sophisticated that you couldn’t check it if you tried. And that suggests another risk we don't talk about enough: every time we hand work to a wizard, we lose a chance to develop our own expertise, to build the very judgment we need to evaluate the wizard's work.

But I come back to the inescapable point that the results are good, at least in these cases. They are what I would expect from a graduate student working for a couple hours (or more, in the case of the re-analysis of my paper), except I got them in minutes.

This is the issue with wizards: We're getting something magical, but we're also becoming the audience rather than the magician, or even the magician's assistant. In the co-intelligence model, we guided, corrected, and collaborated. Increasingly, we prompt, wait, and verify… if we can.

So what do we do with our wizards? I think we need to develop a new literacy: First, learn when to summon the wizard versus when to work with AI as a co-intelligence or to not use AI at all. AI is far from perfect, and in areas where it still falls short, humans often succeed. But for the increasing number of tasks where AI is useful, co-intelligence, and the back-and-forth it requires, is often superior to a machine alone. Yet, there are, increasingly, times when summoning a wizard is best, and just trusting what it conjures.

Second, we need to become connoisseurs of output rather than process. We need to curate and select among the outputs the AI provides, but more than that, we need to work with AI enough to develop instincts for when it succeeds and when it fails. We have to learn to judge what's right, what's off, and what's worth the risk of not knowing. This creates a hard problem for education: How do you train someone to verify work in fields they haven't mastered, when the AI itself prevents them from developing mastery? Figuring out how to address this gap is increasingly urgent.

Finally, embrace provisional trust. The wizard model means working with “good enough” more often, not because we're lowering standards, but because perfect verification is becoming impossible. The question isn't “Is this completely correct?” but “Is this useful enough for this purpose?”

We are already used to trusting technological magic. Every time we use GPS without understanding the route, or let an algorithm determine what we see, we're trusting a different type of wizard. But there's a crucial difference. When GPS fails, I find out quickly when I reach a dead end. When Netflix recommends the wrong movie, I just don't watch it. But when AI analyzes my research or transforms my spreadsheet, the better it gets, the harder it becomes to know if it's wrong. The paradox of working with AI wizards is that competence and opacity rise together. We need these tools most for the tasks where we're least able to verify them. It’s the old lesson from fairy tales: the better the magic, the deeper the mystery. We'll keep summoning our wizards, checking what we can, and hoping the spells work. At nine minutes for a week's worth of analysis, how could we not? Welcome to the age of wizards.

Subscribe now

Share

image
image
この記事をシェア

関連記事

AI News★42026年6月10日 20:00

Google の技術を採用した Siri AI が登場、しかし世界の多くは利用不可

Apple は WWDC 2026 で、ゼロから再構築された新 Siri AI を発表し、Google の技術を組み込んで多段階対話を実現したが、多くの地域ではまだ利用できない。

AI News★42026年6月10日 19:00

マクドナルド、Google 支援の AI ドライブスルー注文システムをテスト中

マクドナルドは、Google が支援する「ArchIQ」と呼ばれるAIシステムを米国の5店舗で試験運用しており、このシステムがドライブスルーでの注文受付や店舗運営をサポートしている。

MarkTechPost★42026年6月10日 17:26

Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場

Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む