GPT-5.5 の価格引き上げ:実際の費用はどれくらいか(3 分読了)
TLDR AI の分析により、GPT-5.5 は長文プロンプトで出力トークン数が大幅に減少するものの、価格が倍増した結果、ユーザーコストは最大 92% 増加することが実証された。
キーポイント
価格と効率のトレードオフ分析
GPT-5.5 は GPT-5.4 に比べ入力・出力トークン単価が倍増したが、長文プロンプトでは生成トークン数が 19-34% 減少し、コスト上昇を一部相殺している。
プロンプト長による性能の二極化
10K トークンを超える長いプロンプトでは出力が短くなる一方、2K-10K の中程度や 2K 未満の短いプロンプトでは逆に出力が長くなり、コスト増幅が顕著になる。
実証されたコスト増加率
スイッチャーコホート分析の結果、実際のユーザーコストはプロンプトサイズに応じて 49% から最大 92% まで上昇しており、価格改定の影響を直接示している。
影響分析・編集コメントを表示
影響分析
この分析は、AI モデルの価格改定が単なる数値の上昇ではなく、利用パターン(特にプロンプト長)に依存した非対称なコスト構造を生むことを示唆しています。開発者や企業にとっては、新モデルへの移行を安易に行うのではなく、ワークフローの詳細なシミュレーションとコスト最適化が不可欠であることを警告する重要な知見です。
編集コメント
新モデルの性能向上が必ずしもコスト削減に直結しないことを示す、実務家にとって極めて重要なデータです。特に中長文処理を多用するサービスでは、移行による予算超過リスクが高まっているため注意が必要です。
私たちは、Opus に対するコスト分析を新しい GPT-5.5 モデルでも再現しました。GPT-5.5 は、GPT-5.4 に比べて料金が 2 倍に引き上げられてリリースされました:入力トークンは 100 万トークンあたり 2.50 ドルから 5.00 ドルへ、出力トークンは 15 ドルから 30 ドルへと値上がりしています。OpenAI はまた、このモデルは冗長性が少なく、同じタスクに対してより短い完了文を生成すると指摘しています。Opus 4.7 の際と同様に、GPT-5.4 から GPT-5.5 へ移行した利用実績を分析することで、ユーザーにとってのコストへの純粋な影響が何であるかを知りたかったのです。
私たちは、コストが 49% から 92% 増加していることを観測しました。この価格上昇は、より長いプロンプトに対してモデルが完了トークンを 19% から 34% 少なく生成することで緩和されています。
方法論:同じスイッチャーコホートアプローチ
私たちは Opus 4.7 の分析と同じアプローチを使用しました。GPT-5.5 リリース以前にリクエスト数で最も多かったモデルが GPT-5.4 であったユーザー、その後 GPT-5.5 を最頻出モデルとして切り替えたユーザーを特定しました。この「スイッチャーコホート」により、同じユーザーベースにおけるバージョン間の制御された前後比較が可能になります。
GPT-5.4 と 5.5 は同じトークナイザーファミリーを使用しているため、トークナイザーの違いによる調整は不要です。比較は直接的です:同じユーザー、同じワークフロー、異なるモデルバージョン。
GPT-5.5 は冗長性が少ないが、長いプロンプトにおいてのみ
OpenRouter の一貫したトークン数を用いて、モデル間で完了文の長さがどのように変化したかを測定しました:
| プロンプトサイズ | 中央値完了 (5.4) | 中央値完了 (5.5) | 変化 |
|---|---|---|---|
| < 2K トークン | 121 | 129 | +7% |
2K – 10K140213+52%
10K – 25K211143-32%
25K – 50K185150-19%
50K – 128K188136-28%
128K+215143-34%
トークン数が 10K を超えるプロンプトの場合、GPT-5.5 は 19〜34% 少ないトークンを生成します。より短いプロンプトではこのパターンが逆転し、2K トークン未満の完了テキストはほぼ同じ長さですが、2K から 10K の範囲では 52% 長くなります。
実際の費用への影響
切り替えコホート(スイッチャー・コースト)のリクエストから請求されたコストを用いて、OpenRouter トークン 100 万あたりの平均コストを計算しました。これによりプロンプトの長さによる補正が行われ、コスト効率性の直接比較が可能になります。
プロンプトサイズ 5.4 版 OpenRouter トークン 100 万あたりの平均費用(ドル) 5.5 版 OpenRouter トークン 100 万あたりの平均費用(ドル) 変化率
< 2K トークン $4.89 $9.37+92%
2K – 10K $2.25 $3.81+69%
10K – 25K $1.42 $2.15+51%
25K – 50K $1.02 $1.65+62%
50K – 128K $0.74 $1.10+49%
128K+ $0.71 $1.31+85%
分析結果によると、GPT-5.5 の実際の費用は 49% から 92% 増加しました。10k トークンを超える長いプロンプトでは、完了テキストが短くなったことでコスト増が相殺されました。一方、10k トークン未満の短いプロンプトでは、完了テキストが短くならなかったため、より高い費用増を経験しています。
調査手法
- ソース:OpenRouter のリクエストログ
- コホート:リクエスト数で上位モデルとして GPT-5.4 を使用していたが、その後 GPT-5.5 に切り替えたユーザー
- サンプルサイズ:テキストのみ、キャンセルされていないリクエストを 5.4 と 5.5 に分割
- 期間:GPT-5.4 は 2026 年 4 月 21 日〜23 日(ローンチ前)、GPT-5.5 は 2026 年 4 月 25 日〜28 日(ローンチ後、ローンチ当日を除く)
- 正規化:プロンプトトークン数に基づいてバケット分けされた、100 万 OpenRouter トークンあたりのコスト。OpenRouter は OpenAI とは独立してトークンをカウントするため、モデルバージョン間で一貫した基準を提供します。
- コントロール:メディア(画像、ファイル、音声、動画)、キャンセルされたリクエスト、ゼロトークンのリクエストは除外されます
原文を表示
We replicated the cost analysis we did on Opus on the new GPT-5.5 model. GPT-5.5 launched with a 2x price increase over GPT-5.4: input tokens increased from $2.50/M to $5.00/M and output tokens from $15/M to $30/M. OpenAI has also noted that the model is less verbose, producing shorter completions for the same tasks. Just as we did with Opus 4.7 we wanted to know what is the net impact on costs to users by analyzing usage that shifted from GPT-5.4 to GPT-5.5.
We observed cost increases between 49-92%. The price increase is mitigated by the model generating 19-34% fewer completion tokens for longer prompts.
Methodology: Same Switcher Cohort Approach
We used the same approach as our Opus 4.7 analysis. We identified users whose top model by request count was GPT-5.4 prior to the 5.5 launch, who then switched to GPT-5.5 as their top model. This "switcher cohort" gives us a controlled before-and-after comparison of the same user base across model versions.
Since GPT-5.4 and 5.5 use the same tokenizer family, we don't need to control for tokenizer differences. The comparison is direct: same users, same workflows, different model version.
GPT-5.5 Is Less Verbose, But Only for Longer Prompts
Using OpenRouter's consistent token counts, we measured how completion lengths changed between models:
Prompt SizeMedian Completion (5.4)Median Completion (5.5)Change
< 2K tokens121129+7%
2K – 10K140213+52%
10K – 25K211143-32%
25K – 50K185150-19%
50K – 128K188136-28%
128K+215143-34%
For prompts above 10K tokens, GPT-5.5 produces 19-34% fewer tokens. For shorter prompts, the pattern reverses: under 2K tokens completions are roughly the same length, and in the 2K-10K range they are 52% longer.
Actual Cost Impact
Using billed costs from requests in the switcher cohort, we calculated the average cost per million OpenRouter tokens. This normalizes for prompt length, allowing a direct comparison of cost efficiency.
Prompt SizeAvg $/M OR Tokens (5.4)Avg $/M OR Tokens (5.5)Change
< 2K tokens$4.89$9.37+92%
2K – 10K$2.25$3.81+69%
10K – 25K$1.42$2.15+51%
25K – 50K$1.02$1.65+62%
50K – 128K$0.74$1.10+49%
128K+$0.71$1.31+85%
Our analysis shows that GPT-5.5 actual costs increased 49% to 92%. Longer prompts, over 10k tokens, saw costs offset by shorter completions. Shorter prompts, under 10k, experience a higher cost increase where completions did not get shorter.
Methodology
- Source: OpenRouter's request logs
- Cohort: Users whose top model by request count was GPT-5.4, who then switched to GPT-5.5 as their top model
- Sample size: Text-only, non-cancelled requests split across 5.4 and 5.5
- Windows: GPT-5.4: April 21-23, 2026 (pre-launch); GPT-5.5: April 25-28, 2026 (post-launch, launch day excluded)
- Normalization: Cost per million OpenRouter tokens, bucketed by prompt token count. OpenRouter counts tokens independently from OpenAI, providing a consistent baseline across model versions.
- Controls: Excluded media (images, files, audio, video), cancelled requests, and zero-token requests
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み