Gemini Omni と Gemini 3.5 の実演デモ 11 選
Google は Gemini Omni と Gemini 3.5 の新機能を公開し、推論能力と創造性の融合、および複雑なエージェントワークフローの実行支援をデモンストレーションした。
キーポイント
Gemini Omni の特性
推論能力と創造能力を統合し、単なる情報処理から高度なコンテンツ生成へと進化させたモデルである。
Gemini 3.5 の実用性
複雑で自律的なエージェントワークフローを実行するために設計されており、実際の業務自動化への応用が期待される。
デモンストレーションの公開
9 つの実演を通じて、両モデルの具体的な動作や能力範囲を視覚的に示し、ユーザーに理解を促している。
多様な入力からの高品質動画生成
画像、音声、動画、テキストを組み合わせることで、Gemini の現実世界知識に基づいた高品質な動画を生成できます。
自然言語による直感的な動画編集
会話形式の指示で動画を編集でき、キャラクターの一貫性や物理法則、過去のシーンの記憶が保持されるため、複雑な変更も可能になります。
動画アクションの再構築
Gemini Omniを使用すると、撮影した既存の動画に対してプロンプトを入力するだけで、発生している動作を編集したり、新しいキャラクターやオブジェクトを追加したり、予期せぬ瞬間に変換することが可能になります。
無限ループと複雑な視覚効果
照明の調整や、手の上にガラス球体が浮かび、その内部に同じシーンが再帰的に描かれた「インフィニット・オブス(無限の球体)」のような複雑な映像を生成し、カメラアングルを変えてループ動画を作成するデモも紹介されました。
影響分析・編集コメントを表示
影響分析
この発表は、AI モデルが単なるチャットボットや生成ツールから、複雑な業務を自律的に処理する「エージェント」へと進化していることを明確に示しています。特に推論能力と創造性の統合は、クリエイティブ産業や高度な分析が必要な分野における生産性革命の契機となる可能性があります。
編集コメント
2026 年という未来の日付が設定された記事ですが、AI エージェントの自律化と推論能力の強化は業界全体の明確なトレンドです。特に「実行」に焦点を当てた Gemini 3.5 の登場は、実務での AI 活用範囲を大きく広げる可能性があります。
2026 年 5 月 29 日
8 min read
Gemini Omni では、推論能力と創造能力が融合し、Gemini 3.5 は複雑なエージェントワークフローの実行を支援するために設計されています。

あなたのブラウザは音声再生要素をサポートしていません。
記事の聴読
このコンテンツは Google AI によって生成されています。生成 AI は実験的な技術です。
[[duration]] 分
Google I/O 2026 で、私たちは最新のモデルである Gemini Omni と Gemini 3.5 ファミリーを発表しました。
Gemini Omni は、あらゆる入力から何でも生成できる新しいモデルで、まずは動画から始まります。Omni を使えば、画像、音声、動画、テキストを入力として組み合わせ、Gemini の実世界知識に基づいた高品質な動画を生成できます。また、会話を通じて動画を簡単に編集することも可能です。**
そして、Gemini 3.5 は、最先端の知能とアクションを融合させた最新のモデルファミリーです。これは、より能力が高く、知的なエージェントを構築する上で大きな飛躍を表しています。シリーズの開始として、3.5 Flash をリリースします。これは、エージェントやコーディングにおいて最先端のパフォーマンスを提供し、現実世界での実用性をもたらす複雑で長期にわたるタスクにおいて卓越した性能を発揮します。
Gemini Omni と Gemini 3.5 Flash の機能をより明確にご理解いただくため、これらがあなたのお手伝いをできる内容のデモを 9 つご紹介します。
Gemini Omni
会話を通じて動画を編集する。Omni を特別なものにしている一つの機能は、自然言語を使って動画を編集しやすくすることです。すべての指示が前の指示に基づいて積み重ねられていきます。登場人物の一貫性が保たれ、物理法則も成立し、シーンは過去の出来事を記憶しています。つまり、周囲の世界を変革できるのです。特定の要素を変更することも、すべてを変更することも可能です。あなたの動画は、自分自身では撮影できなかった何かを生み出すための出発点となります。
プロンプト: その彫刻を泡で作ってください。
アクションを再考する。あなたが撮影した動画を取り、Omni に何かが起きているかをただ尋ねるだけでよいのです。アクションを編集したり、新しいキャラクターやオブジェクトを追加したり、ある瞬間を予期せぬものへと変換したりできます。
プロンプト:部屋の明かりを消してください。黒と白のチェッカーボード模様の部屋を、手の上をトラッキングしながら浮遊するガラス球体の中に配置します。その内部には、同じ手が球体を持っているという再帰的な表現が含まれており、無限に続く部屋の連鎖が生まれます。カメラはゆっくりと球体の奥へと近づき、ビデオループを作成します。
複数のターンにわたって動画を洗練させる。 環境、アングル、スタイル、あるいは特定のディテールを変更しても、元のシーンの一貫性を失うことはありません。カルーセルをスクロールして、編集がどのように積み重なっていくかを確認してください。
プロンプト:バイオリン奏者が曲を演奏している動画。
Gemini 3.5 Flash
大規模なエージェントタスクに対応する。 3.5 Flash は、Flash シリーズで期待される速度で、複数の次元において大型フラッグシップモデルに匹敵する知能を提供します。この速度とパフォーマンスのバランスにより、3.5 Flash は長期にわたるエージェントタスクの処理に最適です。ここでは Antigravity(反重力)によって駆動され、3.5 Flash が多段階ワークフローを実行し、動的な基準に基づいて非構造化アセットを自動的に名前変更および分類します。
Antigravity によって駆動される 3.5 Flash
更新されたアンチグラビティハーネスと組み合わせることで、3.5 Flash は、最も要求の厳しいユースケースにおいて大規模な問題に対処するために協調型サブエージェントを展開するための強力なエンジンとなります。監督の下では、最先端のパフォーマンスを維持しながら、多段階ワークフローやコーディングタスクを確実に実行できます。
3.5 Flash で、より豊かでインタラクティブな Web UI やグラフィックスを作成しましょう。 3.5 Flash は、Gemini 3 の堅牢なマルチモーダル基盤の上に構築されています。AI Studio で、3.5 Flash がわずか 60 秒でチェックアウトフローの異なる UX アプローチを生成する様子をご覧ください。
3.5 Flash on AI Studio
パーソナル AI エージェントと新しいインテリジェントな体験を試してみましょう。 3.5 Flash は現在、世界中の Gemini アプリおよび検索の AI モードにおけるデフォルトモデルとなっています。そのエージェント機能は、最先端レベルの知能を日常生活に持ち込む新機能を支えています。
3.5 Flash の強化されたエージェント型コーディング機能により、より知的な検索体験が提供されています。例えば、新しい情報エージェント(インフォメーション・エージェント)です。これらは 24 時間年中無休でバックグラウンドで動作し、情報を統合的に推論して、必要な時に必要なものを正確に見つけ出します。包括的な更新通知と、さらに深く掘り下げるための Web リンクを送信するため、ユーザーはすぐに行動を起こすことができます。情報エージェントは、今年夏に Google AI Pro 及び Ultra のサブスクライバー向けにまず導入されます。
情報エージェントは、お気に入りのアスリートがスニーカーのコラボレーションやシグネチャーモデルの発売を発表したかどうかをユーザーに随時更新します。
Google のアンチグラビティ技術と Gemini 3.5 Flash のエージェント型コーディング機能を検索(Search)に直接組み込むことで、質問に対して最適な形式で理想的な回答を即座に構築できるようになりました。これにより、視覚ツールやシミュレーションを含む、ニーズにきめ細かくカスタマイズされた生成型 UI(ジェネレーティブ・UI)を利用できます。これらの生成型 UI 機能は、今年夏から検索サービスで誰でも無料で利用可能になります。
検索(Search)は 3.5 Flash を活用して、Gyroid パターンを説明するインタラクティブなビジュアルを構築します。
ウェディングの計画や新しいフィットネスルーティンの確立など、継続的なタスクにおいて、Search はダッシュボード、トラッカー、ミニアプリのようなカスタムエクスペリエンスを構築し、いつでも戻って利用できるようにします。今後数ヶ月で、Google AI Pro および Ultra のサブスクリプションユーザーを対象に、米国では Search 内で Antigravity を使用して独自の custom experiences(カスタムエクスペリエンス)を作成できるようになります。
Search はカスタムのフィットネストラッカーを構築します。
また、Gemini 3.5 で動作し、Antigravity ハーネスを活用する個人 AI エージェント「Gemini Spark」も登場しました。これは 24 時間 365 日稼働し、あなたのデジタルライフのナビゲーションをサポートし、あなたの指示のもとで代わりにアクションを実行します。Gmail、Docs、Slides など、日常的に依存している Workspace ツールと深く統合されています。Gemini Spark は現在、米国の Google AI Ultra のすべてのサブスクリプションユーザーに対して利用可能です。
Gemini Spark はナッツフリーのスナックのリストを作成し、それを Instacart に追加します。
Gemini Omni Flash は、Google AI Plus, Pro and Ultra のグローバルなすべてのサブスクライバー向けに、Gemini app および Google Flow を通じて展開されています。また、YouTube Shorts や YouTube Create App のユーザーにも無償で展開中です。今後数週間で、API を通じて開発者および企業顧客向けにも展開していきます。
Gemini 3.5 Flash は、Google Antigravity、Google AI Studio の Gemini API、Android Studio、Gemini Enterprise Agent Platform および Gemini Enterprise を通じて一般利用可能です。また、AI Mode in Search のすべてのユーザーにも提供されており、現在、Gemini app においてもグローバルなすべてのユーザー向けに展開中です。
Google の最新ストーリーをあなたのメールボックスへ。
完了しました。あと一歩です。
受信トレイを確認して購読を確定してください。
すでに当ニュースレターに登録されています。
また、以下の方法でも登録可能です。
原文を表示
May 29, 2026
8 min read
With Gemini Omni, Gemini’s ability to reason meets the ability to create, while Gemini 3.5 is built to help you execute complex, agentic workflows.

Your browser does not support the audio element.
Listen to article
This content is generated by Google AI. Generative AI is experimental
[[duration]] minutes
At Google I/O 2026, we announced our latest models: Gemini Omni and the Gemini 3.5 family of models.
Gemini Omni is our new model that can create anything from any input, starting with video. With Omni, you can combine images, audio, video and text as input and generate high-quality videos grounded in Gemini's real-world knowledge. You can also easily edit your videos through conversation.**
Then there’s Gemini 3.5, our latest family of models combining frontier intelligence with action. This represents a major leap forward in building more capable, intelligent agents. We’re kicking off the series by releasing 3.5 Flash. It delivers frontier performance for agents and coding, excelling at complex long-horizon tasks that deliver real-world utility.
To give you a clearer understanding of Gemini Omni and Gemini 3.5 Flash, here are 9 demos of what they can help you do.
Gemini Omni
Edit your videos through conversation.** One capability that makes Omni special is that it gives you an easier way to edit video — with natural language. Every instruction builds on the last. Your characters stay consistent, the physics hold up and the scene remembers what came before. That means you can transform the world around you. Change specific things, or change everything. Your video becomes the starting point for something you never could have filmed yourself.
Prompt: Make the sculpture out of bubbles.
Reimagine the action. Take a video you shot and just ask Omni to change what’s happening. Edit the action, add in new characters or objects or transform a moment into something unexpected.
Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.
Refine your videos across multiple turns. Change the environment, angle, style or even specific details, without ever losing the thread of your original scene. Scroll through the carousel to see how edits build on each other.
Prompt: A video of a violinist playing a song.
Gemini 3.5 Flash
Take on agentic tasks at scale. 3.5 Flash delivers intelligence that rivals large flagship models on multiple dimensions, at the speeds you have come to expect from the Flash series. This balance of speed and performance makes 3.5 Flash ideal for tackling long-horizon agentic tasks. Here, powered by Antigravity, 3.5 Flash executes multi-step workflows to automatically rename and categorize unstructured assets based on dynamic criteria.
3.5 Flash powered by Antigravity
When coupled with the updated Antigravity harness, 3.5 Flash becomes a powerful engine for deploying collaborative subagents to tackle problems at scale for the most demanding use cases. Under supervision, it can reliably execute multi-step workflows and coding tasks while sustaining frontier performance.
Create richer, more interactive web UIs and graphics with 3.5 Flash. 3.5 Flash builds on the strong multimodal foundation of Gemini 3. Watch as 3.5 Flash generates different UX approaches for a checkout flow in just 60 seconds on AI Studio.
3.5 Flash on AI Studio
Try personal AI agents and new intelligent experiences. 3.5 Flash is now the default model for the Gemini app and AI Mode in Search globally. Its agentic capabilities are powering new features to bring frontier-level intelligence to your daily life.
The enhanced agentic coding capabilities of 3.5 Flash are delivering even more intelligent experiences in Search, like our new information agents. Operating in the background, 24/7, these agents intelligently reason across information to find exactly what you need at exactly the right moment. They will send a comprehensive update along with links to the web to dive deeper, so you can take action. Information agents will launch first for Google AI Pro & Ultra subscribers this summer.
An information agent keeps a user updated on whether any of their favorite athletes announce sneaker collabs or signature drops.
Now that we’re bringing the power of Google Antigravity and agentic coding capabilities of Gemini 3.5 Flash right into Search, Search can build the ideal response, in the right format for your question — completely on the fly. So you can get custom generative UI, including visual tools and simulations, tailored precisely to your needs. These generative UI capabilities will be available for everyone in Search this summer, free of charge.
Search leverages 3.5 Flash to build an interactive visual explaining Gyroid patterns.
For your ongoing tasks like planning a wedding or establishing a new fitness routine, Search will also build you custom experiences – like dashboards, trackers or mini apps – that you can keep coming back to. You’ll be able to create your own custom experiences with Antigravity right in Search in the coming months, starting first for Google AI Pro and Ultra subscribers in the U.S.
Search builds a custom fitness tracker.
Then there’s the new Gemini Spark, your personal AI agent, which runs on Gemini 3.5 and uses the Antigravity harness. It runs 24/7, helping you navigate your digital life, taking action on your behalf while under your direction. It’s deeply integrated with the Workspace tools you rely on daily, like Gmail, Docs, Slides and more. Gemini Spark is now available to all Google AI Ultra subscribers in the U.S.
Gemini Spark creates a list of nut-free snacks, then adds them to Instacart.
Gemini Omni Flash is rolling out to all Google AI Plus, Pro and Ultra subscribers globally through the Gemini app and Google Flow. It’s also rolling out at no cost to users on YouTube Shorts and YouTube Create App. In the coming weeks, we'll also be rolling it out to developers and enterprise customers via APIs.
Gemini 3.5 Flash is generally available via Google Antigravity, the Gemini API in Google AI Studio and Android Studio, Gemini Enterprise Agent Platform and Gemini Enterprise. It’s also available for everyone in AI Mode in Search and now rolling out to everyone globally in the Gemini app.
Get more stories from Google in your inbox.
Done. Just one step more.
Check your inbox to confirm your subscription.
You are already subscribed to our newsletter.
You can also subscribe with a
関連記事
2026 年 5 月に発表された最新の AI ニュース
Google は 2026 年 5 月に発表した最新の AI 関連ニュースをまとめた記事で、同月に行われた各種発表や技術動向を紹介している。
ServiceNow、顧客アプリと社内生産性向上にClaudeを採用
ServiceNowが、顧客向けアプリケーションの強化と社内生産性向上のために、AIアシスタント「Claude」を採用した。
独自の脆弱性ハーンを構築する
クラウドフレアは、最先端セキュリティモデルを企業コードベースに適用した「グラスウィング・プロジェクト」の初期調査結果を発表し、AI 脅威からインフラと顧客を守るための防御構造の適応について解説している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み