Google、動画生成向け新「Omni」モデルをテスト中
Google は画像生成ツールと統合した新「Omni」モデルをテスト中であり、2026 年の Google I/O での公開発表が有力視されている。
キーポイント
Omni モデルの登場と統合化
Google は画像生成と動画生成を統一する新モデル「Omni」をテスト中であり、Gemini の UI に表示されることから正式名称となる可能性が高い。
2026 年発表の有力性
激化する AI ビデオ市場競争の中、Google I/O 2026 での製品化発表が現実的なシナリオとして示唆されている。
競合環境との関係
Sora や Runway などの他社製品への対抗策として、Google がマルチモーダル統合戦略を強化している背景がある。
影響分析・編集コメントを表示
影響分析
このニュースは、Google が単一のモデルでマルチモーダル(画像・動画)処理を完結させる戦略へ舵を切ったことを示しており、業界全体が「特化型」から「統合型」AI への移行を加速させる要因となる。2026 年という中長期のロードマップを示すことで、競合他社に対する明確な対抗姿勢と技術的野心をアピールする効果がある。
編集コメント
2026 年という中長期の発表時期が示された点は、開発の成熟度と市場戦略の両面から注目すべき点です。統合型モデルへの移行はユーザー体験の向上に直結する重要な転換点と言えます。
Google は、Omni と呼ばれる新しい Gemini ビデオ生成ツールの準備を進めているようです。Gemini のビデオ生成タブから最近明らかになったスクリーンショットには、「アイデアを始めるか、テンプレートをお試しください。Omni によって駆動されています」という文言が含まれています。この配置が重要なのは、Omni が現在 Veo によって駆動されているアクティブなビデオ生成ツールである「Toucan」の名前が表示される場所の近くにあるからです。これは Google I/O 2025 の前に 発見されていました。
現在、Gemini のビデオ生成フローは Veo 3.1 によって駆動されていると提示されており、画像生成は Nano Banana 2 および Nano Banana Pro に紐付けられています。Google は Nano Banana Pro を Gemini 3 を基に構築されたと説明し、Nano Banana 2 を Gemini 3.1 Flash Image としています。未解決の疑問は、Omni が Veo の新しいラッパーなのか、それとも新しい Gemini ビデオモデルなのか、あるいは画像とビデオを単一システムで処理できる Gemini オムニモデルへの初期段階なのかという点です。Omni は隠された参照だけでなく可視的な UI 文字列にも現れているため、これは公開製品名として意図されている可能性もあります。
真実であれば(まだ非常に推測の域を出ませんが)、Gemini はビデオ出力を持つ初のトップティアオムニモデルとなります!
Google は現在、ビデオには Veo を、画像生成には Gemini ベースの Nano Banana モデルを使用する分割モデル戦略を採用しています。Omni はこれらのトラックをより近づける可能性があります。また、ByteDance の Seedance 2.0 がビデオ生成ベンチマークで首位に立つなど、AI ビデオ分野での競争が激化する中での登場となります。
注視すべき可能性のある発表時期は、Google I/O 2026 です。Google は同イベントが 5 月 19 日から 20 日に開催され、Gemini および広範な AI のアップデートが含まれると述べており、より大規模な Gemini メディア生成機能の発表が行われる妥当な舞台となり得ます。
原文を表示
Google appears to be preparing a new Gemini video-generation tool called Omni. A recently surfaced screenshot from Gemini’s video generation tab includes the line, “Start with an idea or try a template. Powered by Omni.” The placement matters because Omni appears near where "Toucan" is mentioned, a currently active video generation tool powered by Veo, spotted ahead of Google I/O 2025.
Today, Gemini’s video generation flow is presented as powered by Veo 3.1, while image generation is tied to Nano Banana 2 and Nano Banana Pro, with Google describing Nano Banana Pro as built on Gemini 3 and Nano Banana 2 as Gemini 3.1 Flash Image. The open question is whether Omni is a new wrapper for Veo, a new Gemini video model, or an early step toward a Gemini omni-model that can handle images and videos within a single system. Since Omni appears in a visible UI string, not only in hidden references, it may also be intended as a public product name.
If true (as it is still highly speculative), Gemini will be the first top-tier Omni model with video output!
Google currently runs a split-model strategy, with Veo for video and Gemini-based Nano Banana models for image generation. Omni could bring those tracks closer together. It would also arrive amid competition in AI video, with ByteDance’s Seedance 2.0 topping video-gen benchmarks.
The likely launch window to watch is Google I/O 2026. Google says the event runs May 19–20 and will include Gemini and broader AI updates, making it a plausible stage for a larger Gemini media-generation reveal.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み