Gemini 3.5 Flash:利用料は高くなるが、Google は全製品に導入予定
Google は新モデル「Gemini 3.5 Flash」を一般公開し、検索や開発プラットフォームなど全製品に展開する一方、価格を大幅に引き上げ、業界全体の価格上昇トレンドを加速させた。
キーポイント
広範な製品への統合と一般公開
Gemini 3.5 Flash はプレビュー段階を経ずに直接一般提供され、Google Search の AI モード、Android Studio、およびエンタープライズ向けプラットフォームなど、Google の主要製品の基盤として即座に採用された。
大幅な価格改定と競合他社との接近
前世代モデルと比較して入力コストが 3 倍、出力コストが 6 倍に引き上げられ、Google の上位プロモデル「Gemini 3.1 Pro」の価格帯にまで近づいた。
技術仕様の詳細と新 API
知識カットオフは 2025 年 1 月、入力トークン数は約 104 万、出力は約 6.5 万であり、サーバー側履歴管理機能を持つ「Interactions API」がベータ版として導入された。
業界全体の価格上昇トレンド
OpenAI の GPT-5.5 や Anthropic の Claude Opus 4.7 も同様に価格を引き上げており、主要 AI ラボが高性能モデルの価格を押し上げる傾向にあることが示された。
影響分析・編集コメントを表示
影響分析
この発表は、Google が高性能モデルを無料・低価格の消費者向けサービスに広く浸透させる一方で、API ユーザーに対しては明確な価格転換(値上げ)を行う戦略を示しています。これにより、開発者や企業はコスト構造の見直しを迫られ、業界全体で「高品質=高価格」という新たな基準が確立される可能性があります。
編集コメント
高性能化と機能拡張の代償として、ユーザーにとってのアクセスコストが劇的に上昇する局面を迎えています。開発者は今後は、モデル選択におけるコストパフォーマンスの再評価が急務となるでしょう。
今日、Google I/O で Google は Gemini 3.5 Flash をリリースしました。このバージョンは「-preview」修飾子をスキップし、直接一般利用可能となりました。また、Google はこれを主要な製品の多くで活用しているようです。
3.5 Flash は今日から世界中の数十億人に対して利用可能です:
- Gemini アプリおよび Google Search の AI モードを通じてすべてのユーザー向け
- 開発者向けには、エージェントファーストの開発プラットフォームである Google Antigravity および Google AI Studio と Android Studio に搭載された Gemini API
- エンタープライズ向けには、Gemini Enterprise Agent Platform および Gemini Enterprise
通常 Gemini の場合と同様、最も興味深い詳細は What's new in Gemini 3.5 Flash という開発者ドキュメントにまとめられています。このモデルは、以前の Gemini 3.x シリーズと同じプラットフォーム機能セットをほぼ備えていますが、computer use(コンピュータ操作) の機能はありません。モデル ID は gemini-3.5-flash です。知識の更新截止日は 2025 年 1 月で、入力トークンは最大 1,048,576 トークン、出力トークンは最大 65,536 トークンをサポートしています。
Google はまた、現在ベータ版である新しい Interactions API を推進しており、これは私には OpenAI が導入したパターン(特にサーバーサイドでの履歴管理)のバージョンである OpenAI Responses に似ているように見えます。
価格が上昇した
Gemini 3.5 Flash は、目立った価格引き上げを伴っています。"Flash"ファミリーの以前のモデルには、Gemini 3 Flash Preview と Gemini 3.1 Flash-Lite がありました。新しい 3.5 Flash は、3 Flash Preview の価格の 3 倍、3.1 Flash-Lite の価格の 6 倍です(価格比較はこちら をご覧ください)。
入力 100 万トークンあたり 1.50 ドル、出力 100 万トークンあたり 9 ドルという価格設定は、Google の Gemini 3.1 Pro(それぞれ 2 ドルと 12 ドル)の価格に近づいています。
Gemini チームは、3.5 Pro が"来月"にロールアウトされると約束しています。おそらくさらに高い価格になるでしょう。
これは一つの傾向を反映しています:OpenAI の GPT-5.5 は GPT-5.4 よりも 2 倍の価格であり、Claude Opus 4.7 は 新しいトークナイザー を考慮すると、4.6 の約 1.46 倍の価格です。
この価格上昇を踏まえると、Google が無料の消費者向け製品にこれほど多くの自社製品でこれを展開しているのは興味深いことです。主要な AI ラボ 3 つすべてが、API ユーザーの価格許容度を試そうとしているように感じられます。
Artificial Analysis は、独自ベンチマークをモデルに対して実行するコストを公開しており、トークナイゼーションや推論トークンの増加などの要素を考慮に入れるための有用な方法です。比較すべきいくつかの数値は以下の通りです:
- Gemini 3.5 Flash (high): $1,551.60
- Gemini 3.1 Pro Preview: $892.28
- Gemini 3 Flash Preview (Reasoning): $278.26
- Gemini 3.1 Flash-Lite Preview: $93.60
3.5 Flash (high) のベンチマーク実行には、3.1 Pro Preview と比べてはるかに多くの費用がかかりました!
他のベンダーからの数値をいくつか紹介します:
- Claude Opus 4.7 (Adaptive Reasoning, Max Effort): $5,117.14
- Claude Opus 4.7 (Non-reasoning, High Effort): $1,217.23
- GPT-5.5 (xhigh): $3,357.00
- GPT-5.5 (medium): $1,199.14
自転車に乗るペリカン
「自転車をこぐペリカンの SVG を生成してください」というプロンプトを Gemini API で実行したところ、このペリカンが返ってきました。これはかなりすごいものです:

コード内のコメントより:
あのペリカンは、マイアミで開催されている暗号資産(仮想通貨)カンファレンスに参加しているように見えます。
この生成には入力トークンが 11、出力トークンが 14,403 かかり、合計コストは わずか 13 セント未満 でした。
Tags: google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release
Gemini 3.5 Flash は、以前よりも高価になりましたが、Google はこれをあらゆる用途に使用する計画です。
このモデルは、速度とコストのバランスを最適化するために設計されています。特に、大量のテキスト処理やリアルタイムの応答が必要なタスクでその真価を発揮します。
しかし、価格の上昇により、一部のユーザーにとっては利用が難しくなる可能性があります。Google は、この変更が長期的なサービスの質向上に寄与すると考えています。
今後の展開として、より高度な機能を持つモデルとの統合も検討されています。これにより、多様なユースケースに対応できるエコシステムが構築される見込みです。
原文を表示
Today at Google I/O, Google released Gemini 3.5 Flash. This one skipped the -preview modifier and went straight to general availability, and Google appear to be using it for a whole lot of their key products:
3.5 Flash is available today to billions of people globally:
For everyone via the Gemini app and AI Mode in Google Search
For developers in our agent-first development platform Google Antigravity and Gemini API in Google AI Studio and Android Studio
For enterprises in Gemini Enterprise Agent Platform and Gemini Enterprise.
As usual with Gemini, the most interesting details are tucked away in the What's new in Gemini 3.5 Flash developer documentation. It mostly has the same set of platform features as the previous Gemini 3.x series, albeit with no computer use. The model ID is gemini-3.5-flash. The knowledge cut-off is January 2025, and it supports 1,048,576 input tokens and 65,536 maximum output tokens.
Google are also pushing a new Interactions API, currently in beta, which looks to me like their version of the patterns introduced by OpenAI Responses - in particular server-side history management.
The price has gone up
Gemini 3.5 Flash is accompanied by a notable price bump. The previous models in the "Flash" family were Gemini 3 Flash Preview and Gemini 3.1 Flash-Lite. The new 3.5 Flash is 3x the price of 3 Flash Preview and 6x the price of 3.1 Flash-Lite (see price comparison here).
At $1.50/million input and $9/million output it's getting close in price to Google's Gemini 3.1 Pro, which is $2 and $12.
The Gemini team promise that 3.5 Pro will roll out "next month" - presumably at an even higher price.
This fits a trend: OpenAI's GPT-5.5 was 2x the price of GPT-5.4, and Claude Opus 4.7 is around 1.46x the price of 4.6 when you take the new tokenizer into account.
Given the price increase it's interesting to see Google roll it out for so many of their own free-to-consumer products. It feels like all three of the major AI labs are starting to probe the price tolerance of their API customers.
Artificial Analysis publish the cost to run their proprietary benchmark against models, which is a useful way to take things like tokenization and increased volume of reasoning tokens into account. Some numbers worth comparing:
- Gemini 3.5 Flash (high): $1,551.60
- Gemini 3.1 Pro Preview: $892.28
- Gemini 3 Flash Preview (Reasoning): $278.26
- Gemini 3.1 Flash-Lite Preview: $93.60
Running the benchmark for 3.5 Flash (high) cost significantly more than 3.1 Pro Preview!
Here are some numbers from other vendors:
- Claude Opus 4.7 (Adaptive Reasoning, Max Effort): $5,117.14
- Claude Opus 4.7 (Non-reasoning, High Effort): $1,217.23
- GPT-5.5 (xhigh): $3,357.00
- GPT-5.5 (medium): $1,199.14
A pelican on a bicycle
I ran "Generate an SVG of a pelican riding a bicycle" against the Gemini API and got back this pelican, which is a *lot*:

From the code comments: ``
That pelican looks like it's in Miami for a crypto conference.
That one cost me 11 input tokens and 14,403 output tokens, for a total cost of just under 13 cents.
Tags: google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み