OpenAI、新デフォルトモデル「GPT-5.5 Instant」の幻覚現象を大幅に低減と主張
OpenAI は、新デフォルトモデル「GPT-5.5 Instant」が内部評価において幻覚(ハルシネーション)を 52.5% 削減し、事実性の大幅な向上を実現したと発表した。
キーポイント
幻覚の大幅削減
OpenAI は新モデル「GPT-5.5 Instant」が、以前のモデルと比較して生成する誤った主張(ハルシネーション)を 52.5% 減少させたことを報告している。
事実性の向上
同社は内部評価に基づき、新モデルが全般的に「事実に基づいた回答」の質において顕著な改善を遂げたと主張している。
デフォルトモデルとしての採用
この技術的改善は、ChatGPT の新しいデフォルトモデルとして実装され、一般ユーザーの利用環境に即座に反映される見込みである。
影響分析・編集コメントを表示
影響分析
この発表は、生成 AI の実用化における最大の障壁であった「情報の正確性」に対する OpenAI の技術的進歩を示す決定的な証拠であり、企業や個人が AI を業務や日常でより信頼して活用できる基盤を強化します。特にデフォルトモデルとして適用されることで、広範なユーザー層に即座に恩恵がもたらされ、業界全体における事実性の基準引き上げへの圧力となる可能性があります。
編集コメント
「幻覚」の削減は AI の信頼性を高める上で最も重要な指標の一つであり、52.5% という数値は業界標準として非常に注目すべき成果です。ただし、これはあくまで内部評価に基づくデータである点に留意し、第三者による検証結果も今後の動向として追う必要があります。
ジェイ・ピーターズ
テクノロジー、ゲームなどを担当するシニア記者。2019 年に The Verge に加入するまで、Techmeme で約 2 年間勤務した。
ChatGPT の最新デフォルトモデルは、以前ほどでたらめな情報を生成しなくなるかもしれない。ハルシネーション(幻覚)は AI モデルにおける 継続的な課題 だが、OpenAI は 新しい GPT-5.5 Instant モデルが「全体的に事実性において顕著な改善」を遂げたと述べている。
同社は、「内部評価」に基づき、GPT-5.5 Instant は医療、法務、金融などの高リスクなプロンプトを対象とした場合、GPT-5.3 の Instant モデルと比較して「でたらめな主張が 52.5% 減少した」と主張している。また、ユーザーが事実誤認として指摘した特に困難な会話においては、「不正確な主張を 37.3% 削減」したとも述べている。(OpenAI は、モデルの評価方法に関する情報を GPT-5.5 Instant システムカード で一部公開している。)
OpenAI はさらに、画像アップロードの分析や回答のためにウェブ検索を活用すべきタイミングの判断など、「日常的なタスクにおいて GPT-5.5 Instant の能力が向上した」と主張している。GPT-5.5 Instant は「より簡潔で要点を絞った」応答を行い、「無意味な絵文字の使用」も避けるという。
GPT-5.5 Instant を搭載した ChatGPT は、以前のチャットや Gmail などの情報から文脈をより効果的に引き出し、よりパーソナライズされた回答を提供できるようになりました。(これは Google も Gemini で 大規模に投資している機能 です。)また、すべての ChatGPT モデルにおいて、新しい「メモリソース」機能により、チャットボットがパーソナライズされた回答の根拠となった文脈を表示できるようになり、必要に応じて情報の削除や修正も可能になります。
このコンテンツは、あなたのクッキー設定のため表示されていません。このコンテンツを読み込むには、以下の「許可」ボタンをクリックして、「ソーシャルメディアおよび埋め込みコンテンツ」用のクッキーをオプトインしてください。これらのクッキーは、埋め込まれたコンテンツの元となる第三者ソースによって設定・管理されます。
OpenAI は火曜日から GPT-5.5 Instant を「すべての ChatGPT ユーザー」に向けて段階的に展開を開始しますが、GPT-5.3 Instant は「廃止されるまで」3 か月間は選択肢として残ります。(過去にはユーザーが 古いモデルの喪失を悼む こともありましたが、これにより移行のための時間を確保できます。)
強化されたパーソナライズ機能はまず Web 版の Plus および Pro ユーザー向けに展開され、モバイルアプリへの対応も「まもなく」開始されます。OpenAI は、この機能を「まもなく」Free、Go、Business、Enterprise の各プランのユーザーにも提供するための「計画」を持っています。また、「メモリソース」機能は現在 Web 版の ChatGPT コンシューマー向けプランで展開されており、モバイル版への対応も「まもなく」行われます。
5月5日更新: GPT-5.5 Instant のシステムカードへのリンクを追加しました。
この記事のトピックや著者をフォローして、パーソナライズされたホームページフィードで類似の記事をもっと見たり、メール更新を受け取ったりしましょう。
- Jay Peters
原文を表示
Jay Peters
is a senior reporter covering technology, gaming, and more. He joined The Verge in 2019 after nearly two years at Techmeme.
OpenAI’s newest default model for ChatGPT might not make stuff up as much. Hallucinations have been an ongoing problem for AI models, but OpenAI says its new GPT-5.5 Instant model has “significant improvements in factuality across the board.”
The company claims that, based on “internal evaluations,” GPT-5.5 Instant produced “52.5% fewer hallucinated claims” than its Instant model for GPT-5.3 “on high-stakes prompts covering areas like medicine, law, and finance.” GPT-5.5 Instant also “reduced inaccurate claims by 37.3% on especially challenging conversations users had flagged for factual errors.” (OpenAI has some information about how it evaluated the model in its GPT-5.5 Instant system card.)
OpenAI also claims that GPT-5.5 Instant is “more capable across everyday tasks,” like analyzing image uploads and knowing when to turn to the web for an answer. GPT-5.5 Instant has “tighter and more to-the-point” responses and will avoid using “gratuitous emojis.”
With GPT-5.5 Instant, ChatGPT is now “more effective” at pulling in context from things like previous chats and your Gmail to give you more personalized responses, too. (This is a feature that Google is investing heavily in for Gemini as well.) And for all ChatGPT models, a new “memory sources” feature will let the chatbot show what context was used to inform personalized responses, and you can delete or correct information if you need.
This content isn't visible due to your cookie preferences. To load this content, click the Allow button below to opt in to "Social Media & Embedded Content" cookies. These cookies are set and controlled by the third party sources from which the embedded content originates.
OpenAI will start rolling out GPT-5.5 Instant on Tuesday to “all ChatGPT users,” though GPT-5.3 Instant will be an option for three months until it’s “retired.” (In the past, users have mourned the loss of older models, so this gives people time to transition.)
The enhanced personalization will roll out first to Plus and Pro users on the web and is “coming soon” to the mobile apps. OpenAI has “plans” to bring it “soon” to Free, Go, Business, and Enterprise users. The memory sources feature is rolling out to ChatGPT consumer plans now on the web “and soon on mobile.”
*Update, May 5th: Added a link to GPT-5.5 Instant’s system card.*
Follow topics and authors from this story to see more like this in your personalized homepage feed and to receive email updates.
- Jay Peters
-
-
-
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み