TLDR AI·2026年5月4日 09:00·約2分

Google、動画生成向け新「Omni」モデルをテスト中

#マルチモーダル #Google Gemini #動画生成 AI #Omni モデル

TL;DR

Google は画像生成ツールと統合した新「Omni」モデルをテスト中であり、2026 年の Google I/O での公開発表が有力視されている。

AI深層分析2026年5月4日 23:03

重要/ 5段階

深度40%

キーポイント

Omni モデルの登場と統合化

Google は画像生成と動画生成を統一する新モデル「Omni」をテスト中であり、Gemini の UI に表示されることから正式名称となる可能性が高い。

2026 年発表の有力性

激化する AI ビデオ市場競争の中、Google I/O 2026 での製品化発表が現実的なシナリオとして示唆されている。

競合環境との関係

Sora や Runway などの他社製品への対抗策として、Google がマルチモーダル統合戦略を強化している背景がある。

影響分析・編集コメントを表示

影響分析

このニュースは、Google が単一のモデルでマルチモーダル（画像・動画）処理を完結させる戦略へ舵を切ったことを示しており、業界全体が「特化型」から「統合型」AI への移行を加速させる要因となる。2026 年という中長期のロードマップを示すことで、競合他社に対する明確な対抗姿勢と技術的野心をアピールする効果がある。

編集コメント

2026 年という中長期の発表時期が示された点は、開発の成熟度と市場戦略の両面から注目すべき点です。統合型モデルへの移行はユーザー体験の向上に直結する重要な転換点と言えます。

Google は、Omni と呼ばれる新しい Gemini ビデオ生成ツールの準備を進めているようです。Gemini のビデオ生成タブから最近明らかになったスクリーンショットには、「アイデアを始めるか、テンプレートをお試しください。Omni によって駆動されています」という文言が含まれています。この配置が重要なのは、Omni が現在 Veo によって駆動されているアクティブなビデオ生成ツールである「Toucan」の名前が表示される場所の近くにあるからです。これは Google I/O 2025 の前に発見されていました。

現在、Gemini のビデオ生成フローは Veo 3.1 によって駆動されていると提示されており、画像生成は Nano Banana 2 および Nano Banana Pro に紐付けられています。Google は Nano Banana Pro を Gemini 3 を基に構築されたと説明し、Nano Banana 2 を Gemini 3.1 Flash Image としています。未解決の疑問は、Omni が Veo の新しいラッパーなのか、それとも新しい Gemini ビデオモデルなのか、あるいは画像とビデオを単一システムで処理できる Gemini オムニモデルへの初期段階なのかという点です。Omni は隠された参照だけでなく可視的な UI 文字列にも現れているため、これは公開製品名として意図されている可能性もあります。

真実であれば（まだ非常に推測の域を出ませんが）、Gemini はビデオ出力を持つ初のトップティアオムニモデルとなります！

Google は現在、ビデオには Veo を、画像生成には Gemini ベースの Nano Banana モデルを使用する分割モデル戦略を採用しています。Omni はこれらのトラックをより近づける可能性があります。また、ByteDance の Seedance 2.0 がビデオ生成ベンチマークで首位に立つなど、AI ビデオ分野での競争が激化する中での登場となります。

注視すべき可能性のある発表時期は、Google I/O 2026 です。Google は同イベントが 5 月 19 日から 20 日に開催され、Gemini および広範な AI のアップデートが含まれると述べており、より大規模な Gemini メディア生成機能の発表が行われる妥当な舞台となり得ます。

Source

原文を表示

Google appears to be preparing a new Gemini video-generation tool called Omni. A recently surfaced screenshot from Gemini’s video generation tab includes the line, “Start with an idea or try a template. Powered by Omni.” The placement matters because Omni appears near where "Toucan" is mentioned, a currently active video generation tool powered by Veo, spotted ahead of Google I/O 2025.

Today, Gemini’s video generation flow is presented as powered by Veo 3.1, while image generation is tied to Nano Banana 2 and Nano Banana Pro, with Google describing Nano Banana Pro as built on Gemini 3 and Nano Banana 2 as Gemini 3.1 Flash Image. The open question is whether Omni is a new wrapper for Veo, a new Gemini video model, or an early step toward a Gemini omni-model that can handle images and videos within a single system. Since Omni appears in a visible UI string, not only in hidden references, it may also be intended as a public product name.

If true (as it is still highly speculative), Gemini will be the first top-tier Omni model with video output!

Google currently runs a split-model strategy, with Veo for video and Gemini-based Nano Banana models for image generation. Omni could bring those tracks closer together. It would also arrive amid competition in AI video, with ByteDance’s Seedance 2.0 topping video-gen benchmarks.

The likely launch window to watch is Google I/O 2026. Google says the event runs May 19–20 and will include Gemini and broader AI updates, making it a plausible stage for a larger Gemini media-generation reveal.

Source

この記事をシェア

TLDR AI2026年6月26日 09:00

研究科学者の就職活動から得た驚くべき教訓（11 分読）

TLDR AI2026年6月26日 09:00

ツール使用型 LLM エージェントの脆弱性評価手法「RHB」を発表

TLDR AI2026年6月26日 09:00

ある言語モデルのドイツ語話能を削除した件（3 分読）

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む