Anthropic、画像理解能力で OpenAI に追いつく
Anthropic が画像理解能力で OpenAI の GPT-5.5 に匹敵する進展を見せたが、幾何学的推論など根本的な課題は依然として解決されておらず、汎用人工知能への道はまだ遠いことを示唆している。
キーポイント
Claude Fable 5 の画像理解能力の向上
Anthropic が公開した Claude Fable 5 は、アナログ時計の読解や物品数えなど、従来モデルが苦手としていた視覚タスクにおいて GPT-5.5 と同等かやや上回る性能を示し、業界の新基準となった。
汎用知能への懐疑的な示唆
コーディングや数学能力は飛躍的に向上した一方で画像理解の進歩が限定的であることは、単なるデータと計算資源の投入だけでは真の汎用人工知能(AGI)には到達できない可能性を示している。
モデルの公開戦略と安全性
高性能版「Mythos 5」は限定パートナー向けに提供される一方、一般公開版「Fable 5」は危険なリクエストを検知して低性能モデルへ自動転送する新しい安全システムを備えている。
幾何学的推論の限界
最新モデルであっても幾何学的推論能力は幼児レベルにとどまっており、スーパーヒューマンな性能達成には根本的なアーキテクチャの革新が必要であるとの分析が示された。
影響分析・編集コメントを表示
影響分析
この記事は、現在の AI モデルが特定のタスク(画像理解)において劇的な進歩を遂げた一方で、その進歩の質や深さには限界があることを浮き彫りにしています。業界全体が「データと計算資源の投入で AGI が実現する」という前提に疑問を抱くきっかけとなり、今後の研究開発が単なるスケーリングからアーキテクチャの革新へとシフトする必要性を強く示唆します。
編集コメント
画像理解能力の向上は喜ばしい進展ですが、幾何学的推論などの基礎認知能力が依然として幼児レベルである点は、AI の「知能」の本質的な課題を如実に物語っています。スケーリング依存からの脱却が急務であることを示す重要な分析記事です。
火曜日、Anthropic は Claude Mythos 5 と Claude Fable 5 という 2 つの新しいモデルをリリースしました。内部構造を見ると、この 2 つのモデルは非常に似ています。どちらも Anthropic が 2 ヶ月前に発表(ただし一般公開は行わなかった)した Claude Mythos Preview の派生バージョンです。両者を区別するのは、どのようにしてリリースされるかという点です。
Mythos の新バージョンはオリジナルと同様、Project Glasswing というプロジェクトの下で手選定された組織のみが利用可能です。これらの信頼できるパートナーには、比較的制限の少ないアクセス権が付与されます。
一方、Fable は一般公開されています。ただし、いくつかの重要な制限があります。新しいシステムは、顧客がハッキングや生物兵器の設計など危険なリクエストを行ったと判断した場合に自動的に検出し、それらをより能力の低い Claude Opus 4.8(Opus)へ自動転送しようとします。
Mythos と Fable は、コーディング能力において前モデルからの大きな飛躍であり、過去 1 年間の傾向を継続するものです。しかし、他の機能においてはモデルの進歩は限定的です。
例えば、フロンティアモデル(最先端モデル)は歴史的に画像理解で苦戦してきました。これは私が 2024 年と 2025 年に詳しく記録した事実です。最近まで、主要なモデルはアナログ時計を読むや画像内のアイテム数を数えるといった単純なタスクでも困難を極めていました。
そこで公式発表記事を読み進めていた際、この一文が私の目を引きました。「Fable 5 は、ビジョン(視覚)関連のタスクにおける新たな最先端モデルです」
これらのタスク自体はそれほど重要ではありませんが、現代の AI 業界で広く信じられている仮説に対する興味深いテストケースとなっています。すなわち、「十分なデータと計算資源があれば、最先端モデルは真に汎用的な知能を発達させる」という仮説です。新しいモデルが数学やコーディングでは劇的に優れている一方で、画像理解においてはわずかにしか向上していない場合、それは真に汎用的な知能はまだ遠くにある可能性を示唆しています。
そこで私は、Fable 5 とその主要な競合他社のビジョン(視覚)能力を評価することを決めました。これは今年 8 月の GPT-5 に関する記事以来のことです。
私の調査では、Claude Fable 5 と GPT-5.5(ただし Google の Gemini モデルは除く)が、昨年のトップモデルたちを悩ませた多くの画像ベースの問題を一貫して解決できることが分かりました。Fable 5 はこれらのタスクにおいて GPT-5.5 よりもわずかに優れていると言えますが、その差は非常に僅かです。
しかし、これらのモデルにおける進歩はそれほど大きなものではありません。GPT-5.5 と Claude Fable 5 は依然として、幼児レベルの幾何学的推論能力しか有していません。この種のタスクで人間を超えた性能を達成するためには、より根本的なアーキテクチャ(構造)の革新が必要となる可能性があります。
さらに詳しく読む
原文を表示
On Tuesday, Anthropic released two new models — Claude Mythos 5 and Claude Fable 5. Under the hood, the two models are very similar. Both are variants of Claude Mythos Preview, the model Anthropic announced — but didn’t release publicly — two months ago. What differentiates them is how they’re being released.
The new version of Mythos, like the original, will only be available to handpicked organizations under Project Glasswing. These trusted partners will have relatively unfettered access.
Fable, in contrast, is available to the general public. But it comes with some significant restrictions. A new system will try to automatically detect when customers make dangerous requests (like hacking or designing a biological weapon) and automatically re-route them to the less powerful Claude Opus 4.8.
Mythos and Fable are a big step in coding abilities from previous models, a continuation of the trend of the last year. But there are other capabilities where models have made less progress.
For instance, frontier models have historically struggled to understand images, something I documented extensively in 2024 and 2025. Until recently, leading models struggled to perform simple tasks like reading an analog clock or counting the number of items in an image.
So as I was reading the official announcement post, this sentence caught my eye: “Fable 5 is the new state-of-the-art model for tasks involving vision.”
These tasks aren’t all that important in their own right, but they’re an interesting test case for a widely held assumption in the modern AI industry: that with enough data and computing power, frontier models will develop truly general intelligence. If new models are dramatically better at math and coding but only a little bit better at understanding images, that suggests that truly general intelligence might still be far away.
So I decided to evaluate the vision capabilities of Fable 5 and its main rivals, something I haven’t done since this August 2025 article about GPT-5.
I found that Claude Fable 5 and GPT-5.5 (though not Google’s Gemini models) can consistently solve many image-based problems that stumped last year’s top models. Fable 5 is arguably slightly better at these tasks than GPT-5.5, but it’s very close.
But these models haven’t made that much progress. GPT-5.5 and Claude Fable 5 continue to have geometric reasoning capabilities on par with young children. More fundamental architectural innovations may be needed to reach superhuman performance on this type of task.
Read more
関連記事
計画と覚書を伴う三つの実験室
Anthropic は安全に配布可能な Claude の新バージョン「Claude Fable 5」をリリースした。しかし、本ブログは新モデルの機能を十分に検証するまで数日間の猶予を設け、詳細なレビューは金曜または月曜から開始すると明言している。
Mythos との協働がもたらす感覚について
著者は Claude 5 Fable(Mythos クラス初の公開 AI モデル)に早期アクセスし、セキュリティ用途以外の多様なタスクでテストした結果、過去のモデルを凌駕する飛躍的な進歩を確認し、人間と AI の関係性が劇的に変化している可能性を示唆しました。
Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場
Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み