OpenAI の Codex システムプロンプトに「ゴブリンについて語るな」という明記された指示が含まれている件
OpenAI の最新モデル GPT-5.5 のシステムプロンプトから、ユーザーの意図と無関係な会話にまで「ゴブリン」などの架空生物を禁止する具体的な指示が発見され、同社が新たなハルシネーション問題に対処していることが明らかになった。
キーポイント
システムプロンプトの特殊禁止事項
OpenAI Codex CLI の最新オープンソースコードに、GPT-5.5 向けに「ゴブリン、グレイムリン、タヌキ、トロル、オーク、ハト」などの生物に関する言及を厳しく制限する指示が明記されている。
特定モデル特有の課題
以前のモデルには見られないこの禁止事項は、GPT-5.5 においてユーザーの質問と無関係な文脈でこれらの生物を頻繁に言及する新しいハルシネーション現象が発生していることを示唆している。
社内外の反応と対応
ユーザーからの苦情に対し、開発者はマーケティングギミックではないと否定したが、サム・アルトマン CEO 自身が「ゴブリンの瞬間」とジョークを交えてこの現象を受け入れている。
影響分析・編集コメントを表示
影響分析
このニュースは、大規模言語モデルの安全性や制御メカニズムが、単なるコンテンツフィルタリングを超えて、プロンプトレベルでの具体的な挙動制御(System Prompt Engineering)にまで及んでいることを示しています。また、ユーザー体験を損なうような特定のハルシネーションパターンが発生した場合、開発側が即座に対応してシステム指令を更新する柔軟性と、その限界が浮き彫りになる事例と言えます。
編集コメント
「ゴブリン」という一見ふざけたように見える禁止事項は、実は AI の生成物における特定の文脈依存バグに対する深刻な技術的対応の表れです。開発者がプロンプトを直接修正する必要があるほど、この現象がユーザー体験に与える影響が大きいことを示しています。
OpenAI の Codex CLI システムプロンプトには、最新の GPT モデルに対して「ゴブリン、グレムリン、アライグマ、トロル、オーガ、鳩、またはその他の動物や生物について、ユーザーの問い合わせに絶対的かつ明白に関連する場合以外は一切話してはならない」という困惑を覚えるような警告が繰り返し記載されています。
この明示的な運用上の警告は、先週 公開されました。これは OpenAI が GitHub に投稿した Codex CLI の最新オープンソースコードの一部です。この禁止事項は、最近リリースされた GPT-5.5 向けの 3,500 語以上の「基本指示」セット内で 2 回繰り返されており、そこには「明示的な指示がない限り絵文字やダッシュ(em dash)を使用しない」「ユーザーが明確にその操作を要求していない限り、『git reset --hard』や『git checkout --』のような破壊的コマンドは決して使用しない」といった、より穏当な注意喚起も併記されています。
同じ JSON ファイルに含まれる以前のモデル向けのシステムプロンプト指示には、ゴブリンや他の生物への言及に対する特定の禁止事項は含まれておらず、これは OpenAI が最新のモデルリリースで新たに発生した問題に対処していることを示唆しています。ソーシャルメディア における 証言 や 証拠 によると、最近の GPT の会話において完全に無関係な話題でもゴブリンに焦点を当てる傾向があることについて、一部のユーザーが不満 を訴えています。
Codex 担当の OpenAI 社員である Nick Pash は、ソーシャルメディア上で 強く主張 しています。これは GPT-5.5 や Codex について人々に話題を提供するための「マーケティングの仕掛け」ではないと。しかし、このシステムプロンプトに関する噂が広がるにつれて、一部の OpenAI の執行役員はこのジョークに乗っかるのをやめていません。「Codex が ChatGPT の瞬間(ゴブリンの瞬間という意味です、すみません)を経験しているようです」と、OpenAI の CEO Sam Altman は 水曜日の朝にソーシャルメディアで書き込みました。
原文を表示
The system prompt for OpenAI’s Codex CLI contains a perplexing and repeated warning for the most recent GPT model to “never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user’s query.”
The explicit operational warning was made public last week as part of the latest open source code for Codex CLI that OpenAI posted on GitHub. The prohibition is repeated twice in a 3,500-plus word set of “base instructions” for the recently released GPT-5.5, alongside more anodyne reminders not to “use emojis or em dashes unless explicitly instructed” and to “never use destructive commands like ‘git reset --hard’ or ‘git checkout --’ unless the user has clearly asked for that operation.”
Separate system prompt instructions for earlier models contained in the same JSON file do not contain the specific prohibition against mentioning goblins and other creatures, suggesting OpenAI is fighting a new problem that has popped up in its latest model release. Anecdotal evidence on social media shows some users complaining about GPT’s penchant for focusing on goblins in completely unrelated conversations in recent days.
OpenAI employee Nick Pash, who works on Codex, insists on social media that this “isn’t a marketing gimmick” to get people talking about GPT-5.5 and Codex. But that hasn’t stopped some OpenAI executives from leaning into the joke as word of the system prompt spread. “Feels like codex is having a ChatGPT moment. I meant a goblin moment, sorry,” OpenAI CEO Sam Altman wrote on social media Wednesday morning.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み