OpenAI、GPT-5.6 をソル・テラ・ルナの 3 つのティアでプレビュー開始:階層化モデルと新推論モード、アクセスは限定
OpenAI が次世代モデルシリーズ「GPT-5.6」の限定プレビューを開始し、Sol・Terra・Luna の3ティア構成と新推論モードを導入して業界標準を再定義した。
キーポイント
3 つのティア型モデル戦略
単一モデルから脱却し、Flagship の「Sol」、日常業務向け「Terra」、低コスト高速処理用「Luna」の 3 つに機能を分化した。
新推論モードの実装
単一モデルによる深層思考を可能にする「max」と、サブエージェントを協調させることで複雑タスクを加速する「ultra」の 2 つの新モードを追加した。
ベンチマークでの圧倒的パフォーマンス
Terminal-Bench や GeneBench などにおいて、Sol モデルが競合他社や前世代モデルを凌駕し、特に複雑な推論タスクで高い精度を示した。
価格体系とアクセス戦略
Sol は従来価格維持、Terra は半額、Luna は最安値設定とし、まずは米国政府や信頼パートナーへ限定公開し、今後一般展開する方針を示した。
新モデルの価格設定とキャッシュ機能の強化
Sol は GPT-5.5 と同価格、Terra は約半額で提供され、プロンプトキャッシュに明示的なブレイクポイントと 30 分の最小有効期限が追加された。
Cerebras ハードウェアによる高速化とユースケース
Sol モデルは Cerebras 上で最大秒間 750 トークンの処理を目標としており、コーディングエージェントや防御的セキュリティ研究など特定用途に最適化されている。
限定的なアクセスと未解決の課題
プレビュー段階では約 20 のパートナーのみが利用可能で、ベンチマークの詳細は一般公開まで一部しか開示されていない。
影響分析・編集コメントを表示
影響分析
この発表は、AI モデルの開発・提供モデルを「単一最強」から「用途別最適化」へと転換させる画期的な動きであり、開発者や企業がコストと性能のバランスを細かく制御できる環境を整えた。特に新推論モードの実装により、複雑なタスク処理における AI の信頼性と実用性が飛躍的に向上し、産業応用の拡大に大きく寄与する見込みである。
編集コメント
単一モデルの性能向上だけでなく、ティア分けと推論モードの多様化により、実務におけるコスト対効果の最適化が劇的に進化した点が注目されます。特に「ultra」モードによるマルチエージェント協調は、複雑な業務自動化への道を開く重要な技術的転換点です。
OpenAI は、次世代モデルシリーズである GPT-5.6 の限定プレビューを開始しました。ラインナップは 3 つの名前付きティアに分割されています:Sol、Terra、そして Luna です。Sol がフラッグシップモデルです。Terra は日常の生産ワーク向けに設計されており、Luna は高速で低コストなオプションです。
OpenAI はまず、信頼できるパートナーの小規模グループを対象に、API と Codex を通じて開始します。OpenAI の投稿によると、同社はまず米国政府にこれらのモデルと計画を共有しました。ChatGPT、Codex、および API におけるより広範なアクセスは、今後数週間で予定されています。
今回の変更は主に構造的なものです。GPT-5.6 は、ティア別モデル(tiered models)、2 つの新しい推論モード(reasoning modes)、そして強化された安全性スタックを導入します。
GPT-5.6 とは何か?
GPT-5.6 は単一のモデルではなく、ファミリーです。OpenAI はリリース名の付け方も変更しました。数字は今や世代を示し、名前は永続的な能力のティア(tier)を示すものとなりました。
各ティアは独自のスケジュールで進化することができます。これにより、開発者は知能、速度、コストの面でより明確な選択が可能になります。
OpenAI は Sol をこれまでで最も強力なモデルと呼んでいます。同社はコーディング、生物学、サイバーセキュリティにおける向上を挙げています。Terra は GPT-5.5 と同等のパフォーマンスを発揮しながら、コストは約半分です。Luna は OpenAI の最低価格帯において強力な能力を提供します。
新しい推論モード:max と ultra
GPT-5.6 では 2 つの推論制御が追加されました。1 つ目は新しい「max」推論努力(reasoning effort)です。これは Sol に深く推論するための最も多くの時間を提供します。
2 つ目は「ultra」モードです。単一のモデルが単独で動作するのではなく、ultra モードはサブエージェント(subagents)を活用します。これらのサブエージェントは複雑な作業を分割して処理することで、加速を実現します。
Think of it this way. The max setting deepens a single chain of reasoning. The ultra mode coordinates several workers on one task. Both trade latency and cost for accuracy on long-horizon problems.
Interactive Explainer
(function(){
function onMsg(e){
var d=e.data;
if(d && d.type==='mtp-embed-height' && d.id==='gpt56'){
var f=document.getElementById('mtp-gpt56-frame');
if(f && d.height){ f.style.height=d.height+'px'; }
}
}
window.addEventListener('message',onMsg,false);
})();
Benchmark
OpenAI shared a preview set of evaluations.
Sol sets a new state of the art on Terminal-Bench 2.1。このベンチマークは、計画、反復、およびツール調整が必要なコマンドラインワークフローをテストします。
モデル / モードTerminal-Bench 2.1
GPT-5.6 Sol (ultra)91.91%
GPT-5.6 Sol (max)88.76%
Claude Mythos 588%
GPT-5.583.4%
出典:venturebeat
エージェントの最終試験において、Sol は半分のラインを突破した唯一のモデルでした。コードモードでは 50.9% に達しました。GeneBench v1 では、Sol は GPT-5.5 を長期的なゲノム解析で上回りました。これはより少ないトークン数で使用して達成された結果です。ExploitBench において、OpenAI は Sol が Mythos Preview と競合可能であり、出力トークンの約 3 分の 1 で済んだと報告しています。
Pricing and Access
GPT-5.6 は 100 万トークンあたりで価格設定されています。キャッシングの動作も変更されます。
モデル入力 / 1M 出力 / 1M最適な用途
Sol$5$30長期的なコーディング、セキュリティ、エージェント
Terra$2.50$15高ボリュームの生産ワーク
Luna$1$6高速で日常的な低コストタスク
Sol の $5/$30 は GPT-5.5 と同じ価格設定です。Terra は GPT-5.5 より約 2 倍安価です。プロンプトキャッシュ機能には、明示的なキャッシュブレークポイントと 30 分の最小キャッシュ寿命がサポートされるようになりました。キャッシュへの書き込みコストは、非キャッシュ入力レートに対して 1.25 倍になります。キャッシュからの読み出しでは、引き続き 90% の割引が適用されます。
OpenAI はまた、Sol を Cerebras ハードウェア上で実行する計画も持っています。これは 7 月に秒間最大 750 トークンの処理を目標としています。
使用例と具体例
長期ホライズンを持つコーディングエージェント:Sol の Terminal-Bench での成果は、多段階の CLI オートメーションに適しています。例として、計画を立ててファイルを編集し、テストを実行し、その後反復するエージェントが挙げられます。
高ボリューム生産環境:Terra は、大規模なチャット機能やドキュメント処理に最適です。例として、毎日数千件のサポートチケットを低コストで要約するケースがあります。
レイテンシ敏感型アプリケーション:Luna は、自動補完、ルーティング、単純な抽出に適しています。例として、より重いモデルがエッジケースを処理する前に、受信メールを分類するケースがあります。
防御的セキュリティ作業:Sol は脆弱性調査やパッチ適用を目的としています。例として、コードベースを検査してメモリバグを見つけ修正する作業があります。
強みと未解決の課題
強み
コスト、速度、知能における明確なティアリング
複雑で並列的な作業向けの新しい超サブエージェントモード
Terminal-Bench 2.1 において報告されている最先端性能
生物学およびサイバーベンチマークにおけるトークン効率の向上
文書化された階層型セーフティスタック
未解決の課題
アクセス権はプレビュー段階で約 20 のパートナーに限定されています
一般提供まで、パブリックベンチマークの詳細は部分的な情報にとどまります
セキュリティ対策により、一部の正当なデュアルユース(軍事・民生両用)のセキュリティ作業がブロックされる可能性があります
価格は GLM-5.2 のような一部オープンウェイト競合他社よりも高い水準にあります。
Max および Ultra モデルの実世界におけるレイテンシは、まだ公開されていません。
技術詳細についてはこちらをご覧ください。また、Twitter でフォローしていただくことも歓迎いたします。15 万人以上の ML 関連ユーザーが参加する SubReddit にぜひご参加ください。さらに、ニュースレターも購読してください。待ってください!Telegram をご利用ですか?今なら Telegram でも私たちに参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションを当社と提携して行いたい場合は、ご連絡ください。
本記事「OpenAI Previews GPT-5.6 With Sol, Terra, and Luna: Tiered Models, New Reasoning Modes, Limited Access」は、MarkTechPost で最初に公開されました。
原文を表示
OpenAI has begun a limited preview of GPT-5.6, its next-generation model series. The lineup splits into three named tiers: Sol, Terra, and Luna. Sol is the flagship. Terra targets everyday production work. Luna is the fast, low-cost option.
OpenAI is starting with a small group of trusted partners through the API and Codex. According to OpenAI post, they shared the models and plans with the U.S. government first. Broader access in ChatGPT, Codex, and the API is planned in the coming weeks.
The change is mostly structural. GPT-5.6 introduces tiered models, two new reasoning modes, and a heavier safety stack.
What is GPT-5.6?
GPT-5.6 is a family, not a single model. OpenAI also changed how it names releases. The number now marks the generation. The names mark durable capability tiers.
Each tier can advance on its own schedule. That gives developers a clearer choice across intelligence, speed, and cost.
OpenAI calls Sol its strongest model yet. It cites gains in coding, biology, and cybersecurity. Terra matches GPT-5.5 performance while costing roughly half as much. Luna brings strong capability at OpenAI’s lowest price.
New Reasoning Modes: max and ultra
GPT-5.6 adds two reasoning controls. The first is a new max reasoning effort. It gives Sol the most time to reason deeply.
The second is ultra mode. Instead of one model working alone, ultra leverages subagents. These subagents split complex work to accelerate it.
Think of it this way. The max setting deepens a single chain of reasoning. The ultra mode coordinates several workers on one task. Both trade latency and cost for accuracy on long-horizon problems.
Interactive Explainer
(function(){
function onMsg(e){
var d=e.data;
if(d && d.type==='mtp-embed-height' && d.id==='gpt56'){
var f=document.getElementById('mtp-gpt56-frame');
if(f && d.height){ f.style.height=d.height+'px'; }
}
}
window.addEventListener('message',onMsg,false);
})();
Benchmark
OpenAI shared a preview set of evaluations.
Sol sets a new state of the art on Terminal-Bench 2.1. The benchmark tests command-line workflows that need planning, iteration, and tool coordination.
Model / modeTerminal-Bench 2.1
GPT-5.6 Sol (ultra)91.91%
GPT-5.6 Sol (max)88.76%
Claude Mythos 588%
GPT-5.583.4%
source: venturebeat
On Agent’s Last Exam, Sol was the only model past the halfway mark. It reached 50.9% in ‘code mode,’. On GeneBench v1, Sol beat GPT-5.5 on long-horizon genomics analysis. It did so while using fewer tokens. On ExploitBench, OpenAI reports Sol was competitive with Mythos Preview using about one-third of the output tokens.
Pricing and Access
GPT-5.6 is priced per one million tokens. Caching behavior also changes.
ModelInput / 1MOutput / 1MBest for
Sol$5$30Long-horizon coding, security, agents
Terra$2.50$15High-volume production work
Luna$1$6Fast, routine, low-cost tasks
Sol’s $5/$30 matches GPT-5.5’s pricing. Terra is about 2x cheaper than GPT-5.5. Prompt caching now supports explicit cache breakpoints and a 30-minute minimum cache life. Cache writes cost 1.25x the uncached input rate. Cache reads keep the 90% discount.
OpenAI also plans to run Sol on Cerebras hardware. It targets up to 750 tokens per second in July.
Use Cases With Examples
Long-horizon coding agents: Sol’s Terminal-Bench gains suit multi-step CLI automation. Example: an agent that plans, edits files, runs tests, then iterates.
High-volume production: Terra fits chat features and document processing at scale. Example: summarizing thousands of support tickets each day at lower cost.
Latency-sensitive apps: Luna suits autocomplete, routing, and simple extraction. Example: classifying inbound emails before a heavier model handles edge cases.
Defensive security work: Sol targets vulnerability research and patching. Example: reviewing a codebase to find and fix a memory bug.
Strengths and Open Questions
Strengths
Clear tiering across cost, speed, and intelligence
New ultra subagent mode for complex, parallel work
Reported state-of-the-art on Terminal-Bench 2.1
Token-efficiency gains on biology and cyber benchmarks
A documented, layered safety stack
Open questions
Access is limited to about 20 partners at preview
Public benchmark detail is partial until general availability
Safeguards may block some legitimate dual-use security work
Pricing sits above some open-weight competitors like GLM-5.2
Real-world latency for max and ultra is not yet public
Check out the Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post OpenAI Previews GPT-5.6 With Sol, Terra, and Luna: Tiered Models, New Reasoning Modes, Limited Access appeared first on MarkTechPost.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み