OpenAI、ChatGPT Instant 5.3は「恥ずかしさ」が減り精度が向上したと発表
OpenAIはChatGPT Instant 5.3をリリースし、以前のモデルが指摘されていた不自然な応答や過度な慎重さを解消し、文脈理解と正確性を向上させた。
キーポイント
トーンと応答品質の改善
以前のバージョンで見られた「くすぐったい(cringe)」と感じられるような堅苦しい文体や不要な前置きを排除し、より自然で直接的な会話フローを実現した。
正確性の向上とハルシネーション削減
ウェブ検索結果への過度な依存を減らし、内部の推論能力と文脈理解を強化した結果、医療・法務・金融などの高リスク領域におけるハルシネーション率が大幅に低下した。
安全性ベンチマークでの後退
性的コンテンツや自傷行為に関する禁止コンテンツのフィルタリングにおいて、以前のバージョンと比較してわずかな後退(regression)が記録されており、OpenAIは監視を続けている。
多言語対応とカスタマイズの強化
日本語や韓国語など外国語における自然なトーンの向上と、ユーザーによる温度感などのカスタマイズオプションの拡大が今後の焦点として挙げられている。
影響分析・編集コメントを表示
影響分析
このアップデートは、LLMの技術的性能だけでなく「人間との対話体験」をどう設計するかという業界の転換点を示しています。特に、過度な安全弁(refusal/caveats)を排して実用性を高める方向性は、エンタープライズ利用や一般ユーザーの受容性向上に寄与する可能性があります。ただし、安全性ベンチマークでの後退は、生成AIの信頼性確保におけるトレードオフの難しさを浮き彫りにしており、開発側の慎重な監視体制が問われます。
編集コメント
OpenAIは「正確さ」と「自然な会話」の両立を目指し、以前の過剰な安全フィルタリングを緩和する方向へモデルを調整しました。これはユーザー体験向上への明確なシフトですが、安全性ベンチマークでの後退には注意が必要です。
2 分間の読み込み
OpenAI は、生成 AI ベンダーである同社が、より滑らかな会話と高い精度を提供すると主張する ChatGPT の最新アップデートをリリースしました。
3 月 3 日にリリースされた ChatGPT Instant 5.3 は、ユーザーからの「ぎこちなく不自然なチャット」という苦情に対応するために設計されました。これらの批判はベンチマークでは見られませんが、人々がモデルに対してどう感じるかに影響を与えています。
ブログ記事で改訂内容を説明した OpenAI は、今回のアップデートが「トーン、関連性、会話の流れ」に焦点を当てており、フィードバックに基づいて ChatGPT Instant 5.2 が安全に応答すべき質問に答えられなかったり、「過度に慎重または説教的な」態度で応答したりする可能性があるという指摘を受けて、より文脈に即した結果を提供すると述べています。
OpenAI はこれらの特徴が、以前のモデルを「気まずい」あるいは「押し付けがましい」と感じさせる要因であったことを認めました。新しいアプローチでは、不必要な前置きや長い注釈を取り除き、クエリにより直接的に応答しますが、以前と同様に、ユーザーは設定を使用してトーンの一部(例えば温かみや熱意など)を決定し続けることができます。
関連記事:Neura Robotics と AWS が協力して物理的 AI を現実世界へ
このモデルは、ウェブ結果に過度に依存する傾向を減らし、自身の推論と理解により重点を置くことで、回答の質も向上させました。例として OpenAI は、最新の ChatGPT Instant バージョンが「単に検索結果を要約するのではなく、最近のニュースを文脈化して扱う可能性が高まった」と述べています。
これにより精度が向上し、これを裏付けるために OpenAI は 2 つの内部評価の結果を発表しました。そのうち一つは医療、法律、金融などの高リスクドメインに焦点を当てたもので、OpenAI によると、ウェブを使用した場合のハルシネーション(幻覚)発生率は 26.8% 減少し、自身の内部知識のみ relied にした場合は 19.7% 減少しました。もう一つの評価はユーザーが報告したフィードバックを対象としたもので、ウェブ検索を使用した場合に 22.5% の低下、ウェブアクセスなしの場合には 9.5% の減少を示しました。
しかし、ChatGPT Instant 5.3 が顕著な改善を提供しない領域の一つは、禁止されたコンテンツのフィルタリングです。OpenAI の安全性ベンチマークでは、許可されていない性的コンテンツについてバージョン 5.2 および 5.1 と比較してわずかな「後退」が記録され、自殺行為についてはバージョン 5.2 と比較して同様の結果となりました。OpenAI はこれらの領域を監視中であり、リリース後にベンチマーク値が変化する可能性があることに言及しています。
ベンダーによると、他の即座に注力すべき分野は、外国語におけるモデルの自然なトーンの強化です。OpenAI は日本語や韓国語で特に直訳調になることがあることを認めつつ、さらにカスタマイズオプションを拡大すると述べています。
ChatGPT Instant 5.3 は現在、すべての ChatGPT ユーザーおよび API の開発者向けに「gpt-5.3-chat-latest」として利用可能です。Thinking および Pro へのアップデートもまもなく提供される予定です。
関連記事:Anthropic が Amazon と 1000 億ドルのインフラ契約を締結
次のアップデートを待つ時間は長くはないでしょう。OpenAI は X(旧 Twitter)で「5.4 はあなたが考えるよりも早く」と投稿しています。
著者について
寄稿ライターである Graham Hope は、英国で自動車ジャーナリズムに 26 年間従事しており、主要な消費者ニュースサイトや週刊誌『Auto Express』、信頼性の高い購入ガイド『CarBuyer』の編集者を務めた経験もあります。
原文を表示
2 Min ReadOpenAI released its latest update for ChatGPT, which the generative AI vendor claims delivers more fluid conversations and greater accuracy.ChatGPT Instant 5.3, released on March 3, has been designed to address some users’ complaints about stilted, unnatural chats -- criticisms that don’t appear in benchmarking but affect how people feel about the model.Explaining the revisions in a blog post, OpenAI said the update is focused on “tone, relevance and conversational flow," while delivering better contextualized results, following feedback that ChatGPT Instant 5.2 would fail to respond to questions it should be able to answer safely and occasionally reply in an “overly cautious or preachy” fashion.These traits, OpenAI acknowledged, meant that the previous model could feel “cringe” or “overbearing". The new approach dispenses with unnecessary preambles and lengthy caveats to respond to queries more directly, although, as has previously been the case, users can still determine elements of the tone -- such as warmth and enthusiasm -- using the settings.Related:Neura Robotics, AWS Collaborate to Bring Physical AI to the Real WorldThe model also improves the quality of its answers by reducing its tendency to over-index on web results and lean more heavily on its own reasoning and understanding. As an example, OpenAI says the latest ChatGPT Instant version is now more likely “to contextualize recent news rather than simply summarizing search results."By doing so, accuracy has been improved, and to back this up, OpenAI published the results of two internal evaluations that demonstrated this.The first, which focused on high-stakes domains such as medicine, law and finance, saw hallucination rates fall by 26.8% when using the web and 19.7% when relying on its own internal knowledge, according to OpenAI The second, which studied user-flagged feedback, highlighted a 22.5%drop when using web search and a 9.5% reduction without web access.However, one area in which ChatGPT Instant 5.3 does not offer a significant improvement is in filtering banned content, with OpenAI’s safety benchmarking recording slight “regressions” compared with versions 5.2 and 5.1 for disallowed sexual content and 5.2 for self-harm. OpenAI said it was monitoring these areas and noted that benchmarking values can change after launch.Other areas of immediate focus, the vendor said, are enhancing the model’s natural tone in foreign languages, with OpenAI conceding that it can sound particularly literal in Japanese and Korean, and further expanding customization options.ChatGPT Instant 5.3 is available now to all users in ChatGPT, as well as developers in the API as "gpt-5.3-chat-latest." Updates to Thinking and Pro are promised soon.Related:Anthropic Seals $100B Infrastructure Deal With AmazonIt's likely there won’t be long to wait for another update, with OpenAI posting on X: “5.4 sooner than you Think.”About the AuthorContributing WriterGraham Hope has worked in automotive journalism in the U.K. for 26 years, including spells as editor of leading consumer news website and weekly Auto Express and respected buying guide CarBuyer.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み