Gemini APIで利用可能なGemini 2.5 FlashおよびPro、Live API、Veo 2
GoogleはGemini APIにおいて、最新のGemini 2.5 FlashおよびProモデル、リアルタイム対話を可能にするLive API、高品質動画生成モデルVeo 2の一般提供を開始し、開発者向けAIツールの大幅な拡充を発表した。
キーポイント
Gemini 2.5モデルの提供開始
Gemini 2.5 FlashとProという2つの最新「思考モデル」がGemini APIで利用可能になり、より高度な推論能力と効率性を提供する。
Live APIによるリアルタイム対話の実現
新たなLive APIが発表され、AIとのリアルタイムなインタラクションが可能になり、より動的で応答性の高いアプリケーション開発を支援する。
Veo 2の一般提供開始
高品質な動画生成を可能にするVeo 2がGemini APIで一般提供され、開発者はテキストから動画を生成する機能を利用できるようになった。
Google AI Studioの統合プラットフォーム
これらの新機能はGoogle AI Studioを通じて提供され、開発者がGoogleのAI技術を活用して未来を形作ることを支援する統合環境を提供する。
Gemini 2.5 Proの特徴
Googleが発表した最高性能のAIモデルで、応答前に推論する思考モデルの能力を持つ。高度なコーディングモデルとして、視覚的に魅力的なウェブアプリの作成やエージェント型プログラミングアプリケーションの開発に優れている。
Gemini 2.5 Flashの発表
2025年4月9日にGemini 2.5 Flashを発表。思考能力を取り入れながら低レイテンシーとコスト効率を維持する進化版モデル。
Gemini 2.5モデルの特徴と応用
状況に応じて柔軟に思考できるモデルで、高性能なエージェントの構築が可能。100万トークンの入力コンテキストウィンドウを活用したコードアシスタントやコードベース全体の生成推論を加速。
影響分析・編集コメントを表示
影響分析
この発表は、GoogleのAI開発者向けエコシステムの大幅な拡充を示しており、特にリアルタイム対話機能と動画生成機能の一般提供は、競合他社に対する明確な差別化要因となる。開発者はより高度で多様なAI機能を単一のAPI経由で利用できるようになり、AIアプリケーション開発の可能性が大きく広がる。
編集コメント
Googleが開発者向けAIツールの大幅なアップデートを発表し、特にリアルタイム対話と動画生成機能の一般提供は、生成AI競争における重要なマイルストーンと言える。
タイトル: Gemini API で利用可能になった Gemini 2.5 Flash と Pro、Live API、Veo 2
今年の Cloud Next において、開発者の皆さんが Google の AI を活用して未来を形作る手助けとなる、新たなアップデートと機能を発表できることを大変嬉しく思います。最新の Gemini 2.5「思考モデル」、リアルタイム インタラクションを実現する Live API の新たな進展、そして高品質な動画生成のための Veo 2 の一般提供開始まで、今週発表された Google AI Studio の Gemini API 関連の主なアップデートをご紹介します。
Gemini 2.5 で構築する
先日、Google は最も高性能な AI モデルである Gemini 2.5 Pro を発表しました。これは、応答する前に推論する「思考モデル」の能力を示すものです。これまでで最も高度なコーディング モデルである Gemini 2.5 Pro は、視覚的に魅力的なウェブアプリの作成や、エージェント型プログラミング アプリケーションの開発に優れています。
つい先週、Gemini 2.5 Pro は Google AI Studio の Gemini API を通じて開発者の皆さんに利用可能となり、エンタープライズのお客様向けには Vertex AI でも利用可能になりました。
そして、2025年4月9日(現地時間)には Gemini 2.5 Flash を発表しました。この人気の高い主力モデルの進化版は、思考能力を取り入れながら、低レイテンシーとコスト効率を維持します。
これは、すべての Gemini モデルが状況に応じて柔軟に思考できるようにするという Google のビジョンにおける重要なステップです。Gemini 2.5 モデルで構築することで、より高性能なエージェントが可能になります。マルチエージェント システムの管理だけでなく、100万トークンの入力コンテキスト ウィンドウを活用したコード アシスタントや、コードベース全体の生成推論を加速することが可能となり、アプリケーション向けの新たなユースケースが生まれるでしょう。
Veo 2 が本番環境で利用可能に
Veo 2 が Gemini API で本番環境に対応しました。Veo 2 は、単純な指示から複雑な指示まで対応でき、幅広い視覚スタイルで現実世界の物理法則をシミュレートできます。Veo 2 により、開発者の皆さんはテキストと画像の両方のプロンプトから、アプリケーション内で直接、高品質な動画を生成できます。
- Text-to-Video (t2v): テキストの説明から動画を生成します。
- Image-to-Video (i2v): 画像から動画を生成します。オプションでテキスト プロンプトによるガイダンスも可能です。
その一例として、Wolf Games はパーソナライズされたインタラクティブなストーリー ゲームを作成する生成型ゲーミング プラットフォームを構築しています。Veo 2 を使用することで、Wolf Games はダイナミックで映画的な体験を構築でき、動画のリアリズム、モーションの精度、カメラ制御が大幅に向上しました。Wolf Games では、ビジュアルを望みどおりに仕上げるために必要な反復作業が 60% 以上削減され、制作時間の大幅な短縮により、クリエイティブなビジョンをより迅速に実現できました。
Veo 2 は本日より、Google AI Studio の Gemini API で利用可能です。
- 品質: 720p 解像度 / 毎秒 24 フレーム
- 長さ: 最大 8 秒のビデオ クリップ
- 価格: 生成されたビデオ 1 秒あたり 0.35 米ドル
動画生成機能を備えたインタラクティブなアプリケーションを構築してみませんか? Veo 2 のドキュメント、プロンプト ガイド、そして入門ガイドとしての cookbook をご覧ください。Vertex AI のエンタープライズ グレードの生成メディア(音声や音楽など、他のモダリティも含む)の詳細については、こちら(英語)をご覧ください。
Gemini モデル向け Live API: プレビュー版の新機能
ダイナミックでリアルタイムなインタラクションは、次世代の AI アプリケーションにとって不可欠です。Gemini モデル向け Live API がこのたびプレビュー版となり、開発者の皆さんは大幅に高いレート制限で、より強力でスケーラブルなアプリケーションの構築とテストを開始できます。Google AI Studio の Gemini API と Vertex AI で最新の機能をお試しください。
Live API を使用すると、開発者の皆さんはストリーミングされる音声、動画、テキストを低レイテンシーで処理するアプリケーションやエージェントを構築できます。これは、人間のような自然な会話の生成、ライブ会議への参加、リアルタイムでの状況モニタリングに最適です。
2024年12月の実験的リリース以来、多くの開発者の皆様からフィードバックをいただき、一般公開に向けて要望の多かった機能を追加しました。
- 2 つの新しい音声オプションを備え、さらに 30 の言語を新規サポート。
- 設定可能な音声区間検出 (VAD) に加え、カスタム VAD ソリューションが利用可能な柔軟性を追加。
- スライディング コンテキスト ウィンドウによる実質的に無限のセッションをサポート。
- その他多数の機能はこちら。
Live API は、強力なツール連携機能(検索、コード実行、関数呼び出し)を備えているため、Gemini 2.0 Flash のようなモデルを、高度にインタラクティブなアプリケーションで活用する上で理想的な選択肢となります。
構築を開始するには、Live API のドキュメントと入門 cookbook をご覧ください。
今すぐ構築しよう
今回のアップデートが開発者コミュニティにもたらす可能性に、私たちはとても期待しています。Gemini 2.5 によるより強力な思考能力、Live API によるリアルタイム インタラクション、そして Veo 2 による動画生成。これらの進化を通して、皆さんがこれからどのようなものを構築されるのか、心待ちにしています!
Posted by Tamao Imura - Google Developer Marketing Manager, Japan
原文を表示
*この記事は Shrestha Basu Mallick、Alisa Fortin、Ivan Solovyev、Joana Carrasqueira による Google Developers Blog の記事 "*Gemini 2.5 Flash and Pro, Live API, and Veo 2 in the Gemini API*" を元に翻訳・加筆したものです。詳しくは元記事をご覧ください。***
Gemini 1.5 Flash と Pro 、Live API、そして Veo 2 が Gemini API に登場
**
今年の Cloud Next にて、開発者の皆さんが Google の AI を活用して未来を形作るよう支援するための、新しいアップデートと機能を発表できることを大変嬉しく思います。最新の Gemini 2.5 「思考モデル」、リアルタイム インタラクションを実現する Live API の新たな進歩、そして高品質な動画生成のための Veo 2 の一般提供開始に至るまで、今週発表された Google AI Studio の Gemini API 関連の主なアップデートをご紹介します。
Gemini 2.5 で構築する
先日、Google は最も高性能な AI モデルである Gemini 2.5 Pro (英語) を発表しました。これは、応答する前に推論する思考モデルの能力を示すものです。これまでで最も高度なコーディング モデルである Gemini 2.5 Pro は、視覚的に魅力的なウェブアプリの作成や、エージェント型プログラミング アプリケーションの開発に優れています。
つい先週、Gemini 2.5 Pro は、Google AI Studio の Gemini API を通じて開発者の皆さんにもご利用いただけるようになり、エンタープライズのお客様向けには Vertex AI (英語) でも利用可能になりました。
そして、 2025 年 4 月 9 日 (現地時間) には Gemini 2.5 Flash を発表しました。この人気の高い主力モデルの進化版は、思考能力を取り入れながら、低レイテンシーとコスト効率を維持します。
これは、すべての Gemini モデルが状況に応じて柔軟に思考できるようにするという Google のビジョンにおける重要なステップです。Gemini 2.5 モデルで構築することで、より高性能なエージェントが可能になります。マルチエージェント システムの管理だけでなく、 100 万トークンの入力コンテキスト ウィンドウを活用したコード アシスタントやコードベース全体の生成推論を加速することが可能となり、アプリケーション向けの新たな事例が生まれるでしょう。
Veo 2 が本番環境に対応
Veo 2 が Gemini API で本番環境に対応しました。Veo 2 は、単純な指示から複雑な指示まで対応でき、幅広い視覚スタイルで現実世界の物理法則をシミュレートできます。Veo 2 により、開発者の皆さんはテキストと画像の両方のプロンプトから、アプリケーション内で直接、高品質な動画を生成できます。
- Text-to-Video (t2v): テキストの説明から動画を生成します
- Image-to-Video (i2v): 画像から動画を生成します。オプションでテキスト プロンプトによるガイダンスも可能です
その一例として Wolf Games は、パーソナライズされたインタラクティブなストーリー ゲームを作成する生成型ゲーミング プラットフォームを構築しています。Veo 2 を使用することで、Wolf Games はダイナミックで映画のような体験を構築でき、動画のリアリズム、モーションの精度、カメラ制御が大幅な向上がみられました。Wolf Games では、ビジュアルを望みどおりに仕上げるために必要な反復作業が 60% 以上削減され、制作時間が大幅に短縮されたことで、クリエイティブなビジョンをより迅速に実現しました。
Veo 2 は本日より、Google AI Studio の Gemini API で利用可能です。
- 品質: 720p の解像度 / 毎秒 24 フレーム
- 長さ: 最大 8 秒のビデオ クリップ
- 価格: 生成されたビデオ 1 秒あたり 0.35 米ドル
動画生成機能を備えたインタラクティブなアプリケーションを構築してみませんか? Veo 2 のドキュメント、プロンプト ガイド、そして入門ガイドとして cookbook をご覧ください。Vertex AI のエンタープライズ グレードの生成メディア(音声や音楽など、他のモダリティも含む)の詳細については、こちら (英語) をご覧ください。
Gemini モデル向け Live API: プレビュー版の新機能
ダイナミックでリアルタイムなインタラクションは、次世代の AI アプリケーションにとって不可欠です。Gemini モデル向け Live API がこの度プレビュー版**となり、開発者の皆さんは大幅に高いレート制限で、より強力でスケーラブルなアプリケーションの構築とテストを開始できます。Google AI Studio の Gemini API と Vertex AI で最新の機能をお試しください。
Live API を使用すると、開発者の皆さんはストリーミングされる音声、動画、テキストを低レイテンシーで処理するアプリケーションやエージェントを構築できます。これは、人間のような自然な会話の生成、ライブ会議への参加、リアルタイムでの状況モニタリングに最適です。
2024 年 12 月の実験的リリース以来、私たちは多くの開発者の皆様からのフィードバックをいただき、 一般公開に向けて要望の多かった機能を追加しました。
- 2 つの新しい音声オプションを備え、さらに 30 の言語を新規サポート
- 設定可能な音声区間検出 (VAD) にカスタム VAD ソリューションが利用できる柔軟性を追加
- スライディング コンテキスト ウィンドウによる実質的に無限のセッションのサポート
- その他多数の機能はこちら
Live API は、強力なツール連携機能(検索、コード実行、関数呼び出し)を備えているため、Gemini 2.0 Flash のようなモデルを、高度にインタラクティブなアプリケーションで活用する上で理想的な選択肢となります。
構築を開始するには Live API のドキュメントと入門 cookbook をご覧ください。
今すぐ構築しよう
今回のアップデートが開発者コミュニティにもたらす可能性に、私たちはとても期待しています。Gemini 2.5 による、より強力な思考能力、Live API によるリアルタイム インタラクション、そして Veo 2 による動画生成。これらの進化を通して、皆さんがこれからどのようなものを構築されるのか、心待ちにしています!
Posted by Tamao Imura - Google Developer Marketing Manager, Japan
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み