AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
One Useful Thing·2026年4月24日 05:00·約10分で読める

未来の兆し:GPT-5.5

#OpenAI#GPT-5.5#Codex#デスクトップアプリ#コーディング支援
TL;DR

One Useful Thingの著者がGPT-5.5 Proへの早期アクセスを報告し、コーディング能力の向上や処理速度の改善、モデル・アプリ・ハarnessの統合によるAI利用体験の変化を示唆している。

AI深層分析2026年4月26日 16:11
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
3
革新性10%
4

キーポイント

1

GPT-5.5 Proの性能と速度の向上

GPT-5.5 Proは、以前のGPT-5.4 Proと比較して処理速度が大幅に向上(33分→20分)し、複雑なコーディングタスクにおいて単なる生成ではなく、動的な進化のモデリングを実現するなど、質的な進歩が見られる。

2

AI利用の3要素(モデル・アプリ・ハarness)の統合

AIを単一のモデルではなく、「モデル」「アプリ(製品)」、「ハarness(ツール連携)」の3つの相互関連する概念として捉えるべきであり、OpenAIはCodexなどのデスクトップアプリを通じてこの統合を推進している。

3

フロントier AIの限界と「ジャギー」な能力

AIの全体的な性能は向上しているものの、特定のタスクにおける能力の偏り(ジャギー)は依然として存在し、技術的な完成度はまだ途上であることを示している。

4

高精度テキストと画像生成の実現

新モデルは、航空機上のカワウソや学術論文のページなど、複雑で詳細なテキストを含む画像を高精度に生成できる。

5

多様な芸術スタイルの再現と実用性

クリムトからピカソまで多様な芸術家のスタイルを再現し、かつラベルも読み取れることから、プレゼン資料やプロダクトモックアップ作成などの実用的な応用が可能。

6

単体ツールを超えた統合の重要性

画像生成モデル自体が魅力的であるだけでなく、実際の課題解決には複数のツールやアプリ、モデルを組み合わせる「統合」こそが真の価値を生む。

7

学術論文の自動生成と評価

GPT-5.5(Codex)を用いて、未整理のデータから仮説生成、文献レビュー、統計分析を含む学術論文を4つのプロンプトだけで作成し、2年生の博士課程レベルの成果を得た。

影響分析・編集コメントを表示

影響分析

この記事は、GPT-5.5 Proの登場が単なる性能向上だけでなく、AI利用のパラダイムシフト(モデル中心からアプリ・ツール連携中心へ)を示唆している点で重要である。特に、開発者や上級ユーザーにとって、Codexのようなデスクトップアプリを通じた実務利用が標準化しつつあることを示しており、企業内のAI導入戦略やツールの選定基準に影響を与える可能性がある。

編集コメント

GPT-5.5 Proの具体的なベンチマーク数値は明記されていないものの、実務的なコーディングタスクにおける速度と精度の向上、およびCodexを通じたツール連携の強化は、開発者コミュニティにとって無視できない進展である。

私は GPT-5.51 に早期アクセスできましたが、これは大きな出来事だと思います。それが大きな意味を持つのは、AI の急速な改善が終わっていないことを示しているからです。また、単に性能が優れている点でも重要です。さらに、これらすべての要素があるにもかかわらず、AI 能力の最前線は依然として不均一なままです。

AI が向上するにつれ、数学や単語の文字数カウントなど、かつて AI が苦手としていた多くのタスクが今では容易に処理できるようになったため、世代ごとの変化を迅速に示すことがますます難しくなっています。そこで、ここでは複雑な詳細を提供しますが、まず良い例となるシンプルなケースを紹介します。AI モデルが最も得意とするのはコーディングなので、OpenAI の最初の推論モデル o3(1 年と 1 週間前にリリース!)から現在の最高性能のオープンウェights モデル(Kimi K2.6)、そして新しい GPT-5.5 Pro まで、さまざまな AI にコーディング課題を出しました。「3000 BCE から 3000 AD までの港町の進化を示す、 procedurally generated(手動生成ではなくアルゴリズムで自動生成される)な 3D シミュレーションを作成してください。美しく見えるもので、かつ私が一定の制御を行えるものをお願いします。」

その後、私はこれらの回答をすべてギャラリーに投稿しました。あなた自身で実験できるようにするためです(実際、このギャラリーページを作成させたのは GPT-5.5 Codex でした)。実際に触れて違いを実感してほしいのですが、以下にいくつかの例を示します。他のすべての次元において優れているだけでなく、GPT-5.5 Pro だけが、単に時間とともに新しい建物の置き換えを生成するのではなく、進化する町をモデル化しました。GPT-5.5 Pro は以前のバージョンよりもはるかに高速です:タスク完了に GPT-5.4 Pro は 33 分、GPT-5.5 Pro は 20 分かかりました。

モデル、アプリ、ハルネス

私はあなたに、AI を単一の存在ではなく、相互に関連する3つの概念のセットとして考えるよう促してきました。Opus 4.7、Gemini 3.1、あるいは(今では)GPT-5.5 といったモデルを考える必要があります。また、実際にモデルと対話するために使用する製品であり、モデルに実務を行わせることができるアプリにも注目してください。最も一般的なアプリは、各モデルのウェブサイトです:chatgpt.com、claude.ai、gemini.google.com。しかし、Claude Code、Claude Cowork、OpenAI Codex といったデスクトップアプリケーションが、AI にとって最も有用なアプリになりつつあります。最後に、ハルネス(harnesses)とは、AI が使用できるツール、およびこれらのツールに AI モデルがどのように接続されているかを指します。ツールにより、AI はあなたのコンピュータを制御し、コードを書き、調査を行い、画像を作成することができます。

OpenAI は三つの分野すべてで進歩を遂げた。モデル面では、GPT-5.5 は強力なモデルファミリーであり、その中で GPT-5.5 Pro(ウェブサイトでのみアクセス可能)が最も能力が高い。アプリ面でも最近大きな進歩があり、OpenAI の Codex は優れた Claude Code の道をたどるようになり、アクセスしやすく有用なデスクトップアプリケーションを提供している。最後に、ハarness(実行環境)とそれらが使用するツールについてである。多くの新しい harness の改善があるが、その中で最も興味深いのは OpenAI によるもので、新しい画像モデルを搭載している。

この新しいモデルは、高品質なテキストのレンダリングや、あなたが説明できるほぼあらゆる画像の作成が可能になった。長年の読者なら私の「カワウソテスト」をご存知だろう。これは、AI に Wi-Fi を使用する飛行機の上のカワウソの画像を作成させるテストだ。それを再度説明する代わりに、新しい画像モデル(GPT-imagegen-2 と呼ばれることもある)に説明させてみよう。「イーサン・モリックのカワウソテストの結果を示すカワウソの科学者の写真。このテストは、AI 画像生成器が Wi-Fi を使用する飛行機の上のカワウソの画像をどの程度作成できるかを示すものである」

image
image

関連する学術論文を見たいか?「カワウソテストに関する学術論文の第1ページを、整えられた状態で机の上に置いた画像で私に見せて」 (テキストにズームインしても構わない)

image
image

それとも、ただの芸術作品として作ればいいのでしょうか?「今、洗練されたアートギャラリーを表示して。壁に飾られたすべての画像は、ラップトップを使用する飛行機上のカワウソで、クリムト、ロスコ、マティス、モネ、ピカソ、ティツィアーノ、レンブラント、オキーフのスタイルで描いてください。それぞれの下部には読み可能なラベルがあるようにしてください。」(これはズームインして確認する価値があります)

image
image

これらはすべて非常にクールで、数ヶ月前には不可能だったことですが、実用的でもあります。詳細なテキストと画像を生成できる画像ジェネレーターは、PowerPointのスライドやプロダクトのモックアップ、あるいは例示用のウェブサイトなど、あなたが求めるあらゆるものを作成するために使用できます。しかし、これは単なるツールの一つに過ぎず、真の魔法は、実際の問題に対してハルネス(基盤モデル)、アプリ、およびモデルを組み合わせる際に発生します。以下は、私が10年間先送りしてきたプロジェクトの例です。

統合する

私は学者であり、AI 以外の業務の多く、特に 2010 年代初頭の作業はクラウドファンディングに焦点を当てていました。私は、このトピックに関する調査、分析、研究作業から収集した何百もの匿名化されたデータファイルを持っており、それらは STATA、CSV、XLS、Word ファイルの混合で、論文としてまとめる機会がありませんでした。この情報を使って GPT-5.5 がどこまでできるかを見てみたかったので、GPT-5.5 搭載の Codex を使用し、「[データ] を整理し、興味深く検証可能な新しい仮説を生成し、洗練された方法でそれをテストし、学術論文を書いてください」と依頼しました。さらに、文献レビューと書式設定も含めるよう求めました。結果は非常に印象的でした。特に、GPT-5.5 Pro に論文のコメントを求め、その結果を Codex にフィードバックした後ではなおさらです。結果はここで確認できます。完璧ではありませんが、それは明らかなエラーがあるためではなく、文献レビューも統計データもすべて実在するものです。むしろ、専門家として、この仮説がそれほど興味深くなく、因果関係に関する標準的な懸念が残っているためです。AI はそれらを解決しようとするために非常に洗練された統計的手法を使用しましたが、それでもです。要約すれば、この論文が 2 年生の博士課程プロジェクトの結果であれば、私は非常に満足していたでしょう。そして、私はテキストに直接手を加えることなく、4 つのプロンプトを与えるだけでこれを実現しました。

image
image

ハーネス、アプリ、モデルを別の方法で統合することも可能です。私はCodexに、完全に新しいテーブルトークロールプレイングゲームを作成するよう依頼しました。これは基本的に、独自の世界観を持つファンタジー世界での『ダンジョンズ&ドラゴンズ』のようなもので、プレイに必要なすべてのテーブルやルールが含まれています。さらに、プレイヤーがゲームを体験するシミュレーションを行い、その結果に基づいてルールを修正することも依頼しました。ご覧の通り、AIはこれに応じ、魅力的な101ページのPDFを作成し、画像生成機能を用いてイラストも描いています。

image
image

技術的に洗練されているだけでなく、実際のコンテンツにも魅力が多数あります。設定は興味深く革新的であり、既存のゲームパターンを参照しつつ独自の要素を加えることで、ルールは理にかなっているように見えます。しかし、よく観察すると、AI の能力の境界線が完全に消えたわけではないことがわかります。AI モデルの世代ごとに、長編小説を実際に構築することには苦戦してきました。もしあなたが AI による文章の頻繁な読者であれば、ここでも同じ問題が見えるでしょう:不気味さへの愛好;完全に報われない過度に複雑なアイデア;奇妙な比喩(「天気と建築は、異なる速度での同じ議論である」);装飾的な文が多すぎる(「海がかつて道であったことを忘れたときに表面化する聖なるものたち」は、一度ならクールですが、そのような内容が全書にわたれば疲れます);すべてのキャラクターが同じ簡潔な口調で話す対話;そして「マラ」という名前。したがって、すべての素晴らしい技術的進歩の中でも、まだ荒々しい部分が残っています。

GPT-5.5は、モデルがますます賢くなり、アプリの機能が強化され、ハルネス(統合環境)が改善されることで、現実の問題解決における効果が高まっていることを示しています。4つのプロンプトから博士論文レベルの論文が得られたり、1つのプロンプトでイラスト付きかつ「プレイテスト済み」の遊べるロールプレイングゲームが生成されたりします。しかし、フィクションは依然として平坦であり、統計的に妥当な場合でも仮説が時として面白みに欠けることがあります。それでもなお、1年前にはこれらが実現する可能性はほとんどなく、最新のリリースでは能力の向上が加速しているように見えます。

GPT-5.5は明らかにこのプロセスの終着点ではありませんが、その過程での重要な一歩です。私は3年以上にわたりこのニュースレターを書き続けていますが、パターンは変わっていません:数ヶ月ごとに新しいモデルが登場し、私のテストを実行すると、以前は不可能だったことが容易になり、かつリリースサイクルごとに飛躍の規模が大きくなっています。境界線は依然として存在しますが、それは以前よりもはるかに先へと伸びています。

購読する

共有する

image
image

これがGPT-5.5がこの記事を描くために選んだ表現であり、それに異議を唱える私が誰でしょうか?

私はOpenAIやその他のAIラボから金銭を受け取っておらず、またOpenAIは私のこの投稿を事前に目にしていません。さらに、私がこれを書いている時点では、ローンチに関する詳細な情報をすべて把握しているわけではないため、誤りがあった場合はご容赦ください。

原文を表示

I had early access to GPT-5.51, and I think it is a big deal. It is a big deal because it indicates that we are not done with the rapid improvement in AI. It is also a big deal because it is just plain good. And it is a big deal because even with all of this, the frontier of AI ability remains jagged.

It is increasingly hard to quickly demonstrate each generational change as AI has gotten better, since a lot of the old things AI was bad at, like math or counting letters in words, are now trivial for AI to do. So, I will give you the complicated details, but first, a simple example that I think is a good illustration. What AI models are best at is coding, so I gave a coding challenge to AIs ranging from OpenAI’s first reasoning model, o3 (released a year and a week ago!) to the current best open weights model (Kimi K2.6) to the new GPT-5.5 Pro: “build me a procedurally generated 3D simulation showing the evolution of a harbor town from 3000 BCE to 3000 AD, it should look beautiful and allow me to have some control over it.”

Then I posted every answer to this gallery so you can experiment with them (actually, I had GPT-5.5 Codex build the gallery page for me). You should play with them to feel the difference, but you can see a few of these examples below. In addition to being better along all the other dimensions, only GPT-5.5 Pro actually modelled an evolving town, rather than just generating new building replacements over time. GPT-5.5 Pro is also much faster than its previous iteration: GPT-5.4 Pro took 33 minutes to complete the task, GPT-5.5 Pro took 20.

Models, Apps, and Harnesses

I have been encouraging you to think about AI not as a single thing, but as a set of three interlinked concepts. You need to consider models, like Opus 4.7, Gemini 3.1, or (now) GPT-5.5. You also want to pay attention to apps, which are the products you actually use to talk to a model, and which let models do real work for you. The most common app is the website for each of these models: chatgpt.com, claude.ai, gemini.google.com. But, increasingly, desktop applications like Claude Code, Claude Cowork, and OpenAI Codex are becoming the most useful apps for AI. Finally, there are harnesses, the tools that an AI can use and how the AI models are hooked up to these tools. Tools allow the AI to control your computer, write code, do research, and make images.

OpenAI has made advances in all three areas. On the model front, GPT-5.5 is a powerful family of models, with GPT-5.5 Pro (accessible only on the website) the most competent. There have also been major advances recently in apps, with OpenAI’s Codex increasingly following the path of the excellent Claude Code and making an accessible and useful desktop application. Finally, there are harnesses and the tools they can use. There have been a lot of new harness improvements, but one of the most interesting is from OpenAI, which has a new image model

This new model can now render high-quality text and create almost any picture you can describe. Long-time readers know about my Otter Test, which asks the AI to make an image of an otter on a plane using wifi. Rather than describe it again, let’s let the new image model (sometimes called GPT-imagegen-2) explain it for me: “a photo of an otter scientist demonstrating the results of Ethan Mollick’s otter test, which shows how well an AI image maker can make images of an otter sitting on an airplane using wifi”

image
image

Maybe you want to see the academic paper about it? “Show me the first page of the academic paper on the Otter test, well-formatted, sitting on a desk” (feel free to zoom in on the text)

image
image

Or maybe we should just make it art? “now show an elaborate art gallery, every image on the walls is an otter on an airplane using a laptop, in the styles of Klimt and Rothko and Matisse and Monet and Picasso and Titian and Rembrandt and O’Keefe. There should be readable labels below each one.” (This is worth zooming in on)

image
image

All of this is very cool, and would have been impossible a few months ago, but it is useful as well. An image generator that can make detailed text and images can be used to make PowerPoint slides or product mockups or example websites or anything else you ask for. But this is just one tool, and the real magic happens when you combine harnesses, apps, and models on a real problem. Here's one I've been procrastinating about for a decade.

Bringing it together

I am an academic, and a lot of my non-AI work, especially in the early 2010s, focused on crowdfunding. I have hundreds of anonymized data files on the topic that I have collected from surveys and analysis and research work, a mix of STATA, CSV, XLS and Word files that I never got around to writing a paper about. I wanted to see how far GPT-5.5 could get with this information. So, I used Codex powered by GPT-5.5 and asked: “Help me sort [the data] out and generate a new hypothesis that might be interesting and test it in sophisticated ways and write an academic paper.” I also asked it to include a literature review and formatting. The results were very impressive, especially after I asked GPT-5.5 Pro to comment on the paper and fed those results back into Codex. You can read the results here. It isn’t perfect, but that is no longer because there are obvious errors: the literature review is all real, as are the statistics. Instead, it is because, as an expert, I think the hypothesis is not that interesting and there are some standard concerns about causation, even though the AI used very sophisticated statistical methods to try and address them. In short, I would have been very happy if this paper was the outcome of a 2nd year PhD project. And I just gave it four prompts, without ever touching the text myself.

image
image

We can bring harnesses and apps and models together another way as well. I asked Codex to create an entirely new tabletop roleplaying game, basically its own version of Dungeons and Dragons in a fantasy world of its own invention, full of all of the tables and rules you need to play. I also asked it to simulate players experiencing the game and revise the rules based on what it found. As you can see, the AI complied, including laying out an attractive 101 page PDF and illustrating it using its image generator.

image
image

In addition to being technically neat, there is a lot to like about the actual content. The setting is interesting and novel, and the rules appear to make sense, drawing on existing game patterns while adding unique elements. However, a closer inspection also reveals the jagged frontier of AI ability is not entirely gone. Every generation of AI models has struggled with actually building long-form fiction. If you are a frequent reader of AI writing you see the same problems here: a love of the uncanny; overly complex ideas that do not fully pay off; weird metaphors (“weather and architecture are the same argument at different speeds”); too many ornate sentences (“the holy things that surface when a sea forgets it was once a road,” is cool once, an entire book of that is exhausting); dialogue where every character speaks in the same clipped tone; and the name “Mara.” So, even amongst all the amazing technical progress, there are still rough edges.

GPT-5.5 shows us that the models keep getting smarter, the apps keep getting more capable, and the harnesses keep getting better, making them ever more effective at solving real problems. I can get a near PhD-quality paper from four prompts or a playable roleplaying game, illustrated and “playtested,” from one. But the fiction is still flat and the hypotheses are sometimes uninteresting even when the statistics are sound. But still. A year ago, none of this was close, and, with the latest releases, capability gains appear to be accelerating.

GPT-5.5 is clearly not the end of this process, but it is a noteworthy step along the way. I have been writing this newsletter for over three years now, and the pattern has not changed: every few months a new model arrives. I run my tests and something that was impossible becomes easy, while the size of the leaps grows each new release cycle. The jagged frontier is still there. It is just much further out than it used to be.

Subscribe now

Share

image
image

This is how GPT-5.5 chose to illustrate this piece, and who am I to argue?

1I take no money from OpenAI or any other AI lab, and OpenAI has not seen this post in advance. Also, I don’t know all the details of the launch at the time I am writing this, so I apologize for any errors.

この記事をシェア

関連記事

AWS Machine Learning Blog★42026年6月2日 06:31

Amazon Bedrock で OpenAI のモデルと Codex が一般利用可能に

AWS は、GPT-5.5、GPT-5.4、および Codex を Amazon Bedrock 上で一般提供開始した。これにより、開発者は同社の高性能推論エンジンを用いて、これらの AI モデルを本番環境のアプリケーションやエージェントへ即時にデプロイできるようになった。

OpenAI News★42026年6月10日 09:00

データから意思決定へ:LSEG が信頼できる AI をどのようにスケーリングしているか

ロンドン証券取引グループ(LSEG)は、金融市場における信頼性の高い AI の活用を拡大し、データ駆動型の意思決定プロセスを支える仕組みを構築した。

The Zvi★42026年6月10日 07:34

計画と覚書を伴う三つの実験室

Anthropic は安全に配布可能な Claude の新バージョン「Claude Fable 5」をリリースした。しかし、本ブログは新モデルの機能を十分に検証するまで数日間の猶予を設け、詳細なレビューは金曜または月曜から開始すると明言している。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む