なぜあなたは如此なのか
Simon Willisonは、ChatGPT Images 2.0が複雑なプロンプト「ペリカンが自転車に乗る」の生成において、指示されていない「WHY ARE YOU LIKE THIS」という看板を独自に追加したことを検証し、モデルの創造性や「slop(粗雑な生成物)」現象を示唆している。
キーポイント
モデルの独自解釈と創造性
ChatGPT Images 2.0は、ユーザーが指定しなかった「WHY ARE YOU LIKE THIS」という看板を画像に追加しており、モデルが文脈やユーモアを独自に解釈して生成していることが確認された。
ベンチマークとしての「Pelican Riding a Bicycle」
Scott J. Lauriaによるこのテストケースは、AI画像生成モデルの複雑な概念の統合能力と、予期せぬ出力(ハルシネーションや創造的付加)を検証するためのベンチマークとして機能している。
生成AIの「Slop」現象への言及
記事はタグで「slop」を指定しており、大量生成されたAIコンテンツの質や、モデルが規則的に生み出す特有のスタイル・エラーに対する業界内の懸念や議論を示している。
影響分析・編集コメントを表示
影響分析
この記事は、大規模画像生成モデルの「創造性」と「誤出力」の境界線について問うものであり、開発者やユーザーにとってモデルの挙動を予測する難しさを浮き彫りにします。ChatGPT Images 2.0の具体的な動作例を示すことで、AI生成コンテンツの信頼性や品質管理(特に「slop」対策)に関する議論を促進する重要な事例となります。
編集コメント
AIモデルが指示されていない情報を付加する現象は、創造性の証でありながら品質管理の課題でもあります。この「ペリカン・テスト」のようなコミュニティ主導の評価基準が、モデルの特性理解にどう寄与するか注目されます。
@scottjla Twitter上で、私のpelican riding a bicycleベンチマークへの返信として以下を投稿しました:
「これらのテストを積み重ねる必要があるように感じます」

モデル(ChatGPT Images 2.0)が「WHY ARE YOU LIKE THIS」というサインを自発的に追加したことを確認するために調査しましたが、実際にそうでした — Scottが使用したプロンプトは以下の通りでした:
宇宙飛行士に乗った馬の画像を作成してください。その宇宙飛行士はペリカンに乗っており、そのペリカンは自転車に乗っています。非常に混沌として見えますが、全員がお互いにバランスを取りながら乗り切っている様子です。
タグ: text-to-image, pelican-riding-a-bicycle, ai, generative-ai, slop, chatgpt
原文を表示
@scottjla on Twitter in reply to my pelican riding a bicycle benchmark:
I feel like we need to stack these tests now
I checked to confirm that the model (ChatGPT Images 2.0) added the "WHY ARE YOU LIKE THIS" sign of its own accord and it did - the prompt Scott used was:
Create an image of a horse riding an astronaut, where the astronaut is riding a pelican that is riding a bicycle. It looks very chaotic but they all just manage to balance on top of each other
Tags: text-to-image, pelican-riding-a-bicycle, ai, generative-ai, slop, chatgpt
関連記事
ロマン・ヒュエ氏の発言を引用
OpenAIのロマン・ヒュエ氏は、GPT-5.4でCodexを統合し、GPT-5.5のコーディング・PC操作能力が大幅向上したと明言し、別個のCodexモデルはリリースしないと確認した。
GPT-5.5 プロンプティングガイド
OpenAIはAPIで利用可能になったGPT-5.5の最適なプロンプト方法に関するガイドを公開し、応答前に長時間思考するアプリケーション向けの有用なヒントを提供している。
OpenAIチーフサイエンティスト「AI進歩は予想以上に遅い」、今後の大幅な飛躍を約束
OpenAIのチーフサイエンティスト、Jakub Pachocki氏は、GPT-5.5の公開を踏まえ、近年のAI開発速度を「予想以上に遅い」と評価し、中期的な大幅な性能向上を保証した。