Google の Gemini Omni ビデオモデルが I/O デビュー前に登場、チャット内で動画編集機能を統合
Google の次期 AI モデル「Gemini Omni」が動画編集機能をチャットに統合し、I/O デビューを前に実力を示したが、映画のような画質では競合他社に劣る状況である。
キーポイント
チャット内での動画リミキシング機能
Gemini Omni モデルは、チャットインターフェース内で直接動画のリミックスや編集を可能にする機能を統合している。
具体的な編集能力と評価
透かし除去やオブジェクトの置換など、実用的な編集機能において早期フィードバックは高く評価されている。
競合との画質比較における課題
動画編集能力は優れているものの、生来の映画のような映像品質(cinematic quality)においては ByteDance の Seedance 2 に劣っている。
段階的なローンチ戦略
Gemini モダリティの統一戦略の一環として、Flash や Pro などティア分けされたバージョンでの展開が検討されている。
影響分析・編集コメントを表示
影響分析
このニュースは、生成 AI が単なるコンテンツ作成から、実用的な編集ツールへと進化しつつあることを示唆しており、クリエイターや企業ユーザーのワークフロー変革に直結する重要な一歩です。一方で、映像品質における競合との差は明確であり、Google には技術的なさらなる磨き上げが求められています。
編集コメント
動画編集機能の実装は即座に業務効率化に寄与する可能性が高いが、映像の芸術的品質において競合を凌駕するにはまだ時間がかかるようだ。今後の I/O 発表での詳細な仕様と価格帯が注目される。
Google の次期 Gemini Omni ビデオモデル に関する新たな兆候が週末に表面化し、Reddit ユーザーが改訂された Gemini インターフェースのスクリーンショットを投稿しました。そこには新しいモデルカードが表示され、「Gemini Omni で創作:新ビデオモデルをご紹介します。動画をリミックスしたり、チャット内で直接編集したり、テンプレートを使ったりできます」という説明文が含まれており、来週のデベロッパーイベントに向けて Google が準備してきたと長年噂されてきた統合アプローチが確認されたようです。この展開は偶発的なものか、あるいは限定された A/B テストの一部の可能性があります。
モデルカードとともに、ユーザーたちは設定内に新しい利用制限タブを発見し、複数の報告によるとビデオ生成でクレジットが急速に消費されるため、Google が Gemini の各表面でテストしているメーター型システム(metered system)と類似した仕組みを示唆しています。初期の出力に対する反応は賛否両論でした。純粋な生成忠実度においては、Omni は ByteDance の Seedance 2 に劣っているように見え、視聴者からは映画のような品質が現在のベンチマークリーダーに一歩譲ると指摘されています。一方、このモデルが目立っていたのは編集機能です。ウォーターマークの除去、クリップ内のオブジェクトの置換、チャットによる指示でのシーン書き換えなど、初めての公開試作としては異例なほどにうまく機能しました。
このパターンは、Gemini でネイティブ画像モデルとして登場し、初期の生成スコアは平凡だったものの編集分野のリーダーボードを制覇し、後に最先端の画像システムへと進化させた Nano Banana と同様のものです。 Google は動画においても同じ戦略を採用しており、発表時の純粋な品質でのトップ地位よりも、Gemini におけるモダリティの統一を優先しているようです。また、Omni は Flash と Pro のような階層化されたバリアントとして提供される可能性があり、現在流通している出力は最もおそらく Flash バージョンからのものであると推測されます。
このタイミングは、5 月 19 日と 20 日に開催される Google I/O に完璧に合致しており、同社は過去にもここで最も野心的な AI の転換点を発表する記録を持っています。イベント直前の短い期間と統制されたリークにより、Google は基調講演の前に反応を集め、物語を形成するための余地を得ています。
原文を表示
Fresh signals around Google’s upcoming Gemini Omni video model surfaced over the weekend, with Reddit users posting screenshots of a revised Gemini interface exposing the new model card. The description read “Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more,” appearing to confirm the long-rumored unified approach Google has been preparing ahead of next week’s developer event. The rollout looked either accidental or part of a limited A/B test.
Alongside the model card, users spotted a new usage limits tab inside settings, and several reported that video generation burned through credits fast, hinting at a metered system similar to what Google has been testing across Gemini surfaces. Early outputs drew mixed reactions. On raw generation fidelity, Omni appears to lag behind ByteDance’s Seedance 2, with viewers noting that the cinematic quality is a step behind the current benchmark leader. Where the model stood out was in editing: removing watermarks, swapping objects within clips, and rewriting scenes via chat instructions all worked unusually well for a first public glimpse.
That pattern mirrors Nano Banana, which launched as a native image model on Gemini, debuted with middling generation scores but topped editing leaderboards, and was later upgraded into a frontier image system. Google appears to be running the same playbook for video, prioritizing modality unification under Gemini over raw quality leadership at launch. There are also hints that Omni will ship in tiered variants, likely Flash and Pro, with the outputs circulating now most likely coming from the Flash tier.
The timing fits neatly with Google I/O on May 19 and 20, where the company has a track record of unveiling its most ambitious AI shifts. A short pre-event window paired with a controlled leak gives Google room to gather reactions and shape the narrative before the keynote.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み