プロジェクト・ジーニー:無限でインタラクティブな世界を実験中
Google DeepMind は、Google AI Ultra 契約者向けに世界モデル「Genie 3」を駆使した実験的プロトタイプ「Project Genie」を提供開始し、テキストや画像によるインタラクティブな世界の即時生成と探索機能を可能にした。
キーポイント
Genie 3 技術の公開
静的なスナップショットではなく、ユーザーの移動や操作に応じてリアルタイムで環境を生成・シミュレートする「Genie 3」世界モデルが中核技術として採用されている。
Project Genie の機能
テキストプロンプトや画像(スケッチ)を入力することで、ユーザーが独自のキャラクターと世界を構築し、それを探索・リミックスできるインタラクティブな体験を提供する。
AGI への道筋
チェスや囲碁といった特定環境のエージェント研究から、現実世界の多様性をナビゲートする汎用世界モデルへ進化させることで、汎用人工知能(AGI)の実現を目指す戦略の一環である。
現状と制限
現時点では物理法則の完全な再現やキャラクター制御に課題が残っているが、ロボティクス、アニメーション、歴史シミュレーションなど多様な分野での応用可能性を示唆している。
World Sketching と視点のカスタマイズ
Nano Banana Pro を統合した「World Sketching」機能により、没入前に世界の外観をプレビュー・微調整でき、1人称や3人称など探索の視点を事前に定義できます。
リアルタイム生成と世界のリミックス
ユーザーの行動に基づいて先頭の世界がリアルタイムで生成されるほか、既存のワールドをプロンプトやギャラリーからリミックスして新たな解釈を生み出せます。
実験的プロトタイプとしての制限と責任
Genie 3 を基盤とする本製品は研究用プロトタイプであり、物理法則の完全な再現やキャラクター制御の遅延など現時点での限界があり、60秒間の生成制限も設けられています。
影響分析・編集コメントを表示
影響分析
この記事は、生成 AI が単なるコンテンツ作成ツールから、動的で物理法則に従う仮想環境を構築・操作できる「世界モデル」へと進化している決定的な転換点を示しています。Google DeepMind の AGI 戦略において、現実世界のシミュレーション能力が不可欠であるという認識が明確化され、ゲーム開発やロボティクス学習の分野における技術的パラダイムシフトの先駆けとなる可能性があります。
編集コメント
「世界モデル」の実用化が加速しており、単なるテキスト生成を超えて物理法則や動的環境を理解・生成する技術が現実味を帯びてきました。AGI 実現に向けた重要なマイルストーンとなる技術発表ですが、現時点では特定のサブスク層限定の実験段階である点に留意が必要です。
プロジェクト・ジェニー:無限でインタラクティブな世界を実験する
米国のGoogle AI Ultra加入者は、世界を作成・探索できる実験的研究プロトタイプ「Project Genie」を試すことができます。
概要
Googleは米国のGoogle AI Ultra加入者向けに「Project Genie」の提供を開始します。Project Genieは、インタラクティブな世界を作成、探索、リミックスできる研究プロトタイプです。テキストプロンプトや画像を使って環境を構築し、リアルタイムで探索できます。
「Project Genie」により、Google AI Ultraユーザーはインタラクティブな世界を作成、探索、リミックスできます。
プロトタイプはGenie 3によって駆動され、ユーザーが移動・相互作用する際にリアルタイムで進路を生成します。
ユーザーはテキストや画像で世界をスケッチし、探索し、既存の作品をリミックスできます。
プロトタイプには世界のリアリズムやキャラクター制御などの制限がありますが、改善中です。
Googleは将来的にProject Genieとその世界構築技術へのアクセス拡大を目指しています。
他のスタイルを探索する:
概要
お使いのブラウザはオーディオ要素をサポートしていません。
8月に、私たちは多様でインタラクティブな環境を生成可能な汎用世界モデル「Genie 3」をプレビューしました。この初期段階においても、信頼できるテスターたちは印象的な幅広い魅力的な世界と体験を作り出し、それを活用する全く新しい方法を発見しました。次のステップは、没入型の世界創造に焦点を当てた専用のインタラクティブなプロトタイプを通じて、アクセスを広げることです。
本日より、米国(18歳以上)のGoogle AI Ultra加入者向けにProject Genieへのアクセス提供を開始します。この実験的研究プロトタイプにより、ユーザーは自身のインタラクティブな世界を作成、探索、リミックスできます。
世界モデルの進化への取り組み
世界モデルは環境の力学をシミュレートし、それがどのように進化し、行動がどのように影響するかを予測します。Google DeepMindにはチェスや囲碁のような特定環境向けのエージェントの歴史がありますが、AGI(人工汎用知能)の構築には、現実世界の多様性をナビゲートするシステムが必要です。
この課題に対処し、AGIミッションを支援するため、私たちはGenie 3を開発しました。静的な3Dスナップショット内の探索可能な体験とは異なり、Genie 3はユーザーが世界を移動し相互作用する際に、前方の進路をリアルタイムで生成します。それは動的な世界の物理や相互作用をシミュレートし、その画期的な一貫性により、ロボティクスやアニメーション・フィクションのモデリングから、場所や歴史的設定の探索に至るまで、あらゆる現実世界のシナリオのシミュレーションを可能にします。
様々な業界・領域の信頼できるテスターとのモデル研究を基盤として、私たちは実験的研究プロトタイプ「Project Genie」で次のステップに進みます。
Project Genieの仕組み
Project Genieは、Genie 3、Nano Banana Pro、Geminiによって駆動されるプロトタイプのウェブアプリで、ユーザーが私たちの世界モデルの没入型体験を直接試すことを可能にします。この体験は、以下の3つのコア機能を中心に構成されています:
- 世界のスケッチ
テキストおよび生成またはアップロードされた画像でプロンプトし、生き生きと広がる環境を作成します。あなたのキャラクターや世界を作り、歩く、乗る、飛ぶ、運転するなど、どのように探索したいかを定義します。
より精密な制御のために、「World Sketching」をNano Banana Proと統合しました。これにより、世界がどのように見えるかをプレビューし、世界に飛び込む前に画像を修正して世界を微調整できます。また、一人称や三人称など、キャラクターの視点を定義でき、シーンに入る前に体験方法を制御できます。
- 世界の探索
あなたの世界は、探索を待つナビゲート可能な環境です。移動すると、Project Genieはあなたの行動に基づいて前方の進路をリアルタイムで生成します。世界を移動しながらカメラを調整することもできます。
- 世界のリミックス
既存の世界のプロンプトを基盤として、新しい解釈へとリミックスします。ギャラリーでキュレーションされた世界を探索したり、インスピレーションを得るためにランダマイザーアイコンを選択したり、それらを基に構築することもできます。そして完了したら、あなたの世界と探索の動画をダウンロードできます。
責任ある構築への取り組み
Project GenieはGoogle Labsの実験的研究プロトタイプで、Genie 3によって駆動されています。汎用AIシステムに向けた私たちのすべての取り組みと同様に、私たちの使命は人類に利益をもたらすために責任を持ってAIを構築することです。Genie 3は初期の研究モデルであるため、改善が望まれるいくつかの既知の領域があります:
生成された世界は完全に写実的でなかったり、プロンプトや画像、現実世界の物理法則に常に密接に従わない場合があります。
キャラクターの制御性が低かったり、制御の遅延が大きい場合があります。
生成は60秒に制限されています。
8月に発表したGenie 3モデルの機能の一部、例えば探索中に世界を変化させるプロンプト可能なイベントなどは、このプロトタイプにはまだ含まれていません。モデルの制限事項や体験を改善する方法に関する将来のアップデートの詳細は、こちらでご覧いただけます。
信頼できるテスターと行ってきた作業を基盤として、私たちは最も先進的なAIのユーザーとこのプロトタイプを共有し、AI研究と生成メディアの多くの領域で人々が世界モデルをどのように使用するかをより深く理解できることを嬉しく思います。
Project Genieへのアクセスは本日より、米国のGoogle AI Ultra加入者(18歳以上)への提供を開始し、適切な時期により多くの地域に拡大します。彼らが創造する無限に多様な世界を見ることを楽しみにしており、将来的には、これらの体験と技術をより多くのユーザーが利用できるようにすることを目標としています。
原文を表示
Project Genie: Experimenting with infinite, interactive worlds
Google AI Ultra subscribers in the U.S. can try out Project Genie, an experimental research prototype that lets you create and explore worlds.
General summary
Google is rolling out Project Genie to Google AI Ultra subscribers in the U.S. Project Genie is a research prototype that lets you create, explore and remix interactive worlds. You can use text prompts and images to build environments and navigate them in real time.
"Project Genie" lets Google AI Ultra users create, explore, and remix interactive worlds.
Genie 3 powers the prototype, generating real-time paths as you move and interact.
Users can sketch worlds with text/images, explore them, and remix existing creations.
The prototype has limitations, like world realism and character control, but is improving.
Google aims to expand access to Project Genie and its world-building tech in time.
Explore other styles:
General summary
Your browser does not support the audio element.
In August, we previewed Genie 3, a general-purpose world model capable of generating diverse, interactive environments. Even in this early form, trusted testers were able to create an impressive range of fascinating worlds and experiences, and uncovered entirely new ways to use it. The next step is to broaden access through a dedicated, interactive prototype focused on immersive world creation.
Starting today, we're rolling out access to Project Genie for Google AI Ultra subscribers in the U.S (18+). This experimental research prototype lets users create, explore and remix their own interactive worlds.
How we’re advancing world models
A world model simulates the dynamics of an environment, predicting how they evolve and how actions affect them. While Google DeepMind has a history of agents for specific environments like Chess or Go, building AGI requires systems that navigate the diversity of the real world.
To meet this challenge and support our AGI mission, we developed Genie 3. Unlike explorable experiences in static 3D snapshots, Genie 3 generates the path ahead in real time as you move and interact with the world. It simulates physics and interactions for dynamic worlds, while its breakthrough consistency enables the simulation of any real-world scenario — from robotics and modelling animation and fiction, to exploring locations and historical settings.
Building on our model research with trusted testers from across industries and domains, we are taking the next step with an experimental research prototype: Project Genie.
How Project Genie works
Project Genie is a prototype web app powered by Genie 3, Nano Banana Pro and Gemini, which allows users to experiment with the immersive experiences of our world model firsthand. The experience is centred on three core capabilities:
- World sketching
Prompt with text and generated or uploaded images to create a living, expanding environment. Create your character, your world, and define how you want to explore it — from walking to riding, flying to driving, and anything beyond.
For more precise control, we have integrated “World Sketching” with Nano Banana Pro. This allows you to preview what your world will look like and modify your image to fine tune your world prior to jumping in. You can also define your perspective for the character — such as first-person or third-person — giving you control over how you experience the scene before you enter.
- World exploration
Your world is a navigable environment that’s waiting to be explored. As you move, Project Genie generates the path ahead in real time based on the actions you take. You can also adjust the camera as you traverse through the world.
- World remixing
Remix existing worlds into new interpretations, by building on top of their prompts. You can also explore curated worlds in the gallery or by selecting the randomizer icon for inspiration, or build on top of them. And once you’re done, you can download videos of your worlds and your explorations.
How we’re building responsibly
Project Genie is an experimental research prototype in Google Labs, powered by Genie 3. As with all our work towards general AI systems, our mission is to build AI responsibly to benefit humanity. Since Genie 3 is an early research model, there are a few known areas for improvement:
Generated worlds might not look completely true-to-life or always adhere closely to prompts or images, or real-world physics
Characters can sometimes be less controllable, or experience higher latency in control
Limitations in generations to 60 seconds
A few of the Genie 3 model capabilities we announced in August, such as promptable events that change the world as you explore it, are not yet included in this prototype. You can find more details on model limitations and future updates on how we’re improving the experience, here.
Building on the work we have been doing with trusted testers, we are excited to share this prototype with users of our most advanced AI to better understand how people will use world models in many areas of both AI research and generative media.
Access to Project Genie begins rolling out today to Google AI Ultra subscribers 1 in the U.S. (18+), expanding to more territories in due course. We look forward to seeing the infinitely diverse worlds they create, and in time, our goal is to make these experiences and technology accessible to more users.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み