テンセント混元3D世界モデル2.0をリリース:ゲームワークフローとシームレスに連携
腾讯が発表したオープンソースの多モーダル3D世界モデル「HY-World 2.0」は、テキストや画像から編集可能な3D資産を直接生成し、ゲームエンジンとの連携を通じて開発ワークフローの効率化を実現する。
キーポイント
編集可能な3D資産の直接生成とエンジン連携
従来の動画生成モデルとは異なり、Meshや3DGS、点云など複数の形式で出力し、UnityやUEなどのゲーム制作・具身シミュレーションエンジンへ直接インポート可能にした。
マルチモーダル入力とスタイルカスタマイズ
テキスト、画像、動画の複数入力に対応し、実写風や漫画風などユーザーが指定したスタイルで高精度な3D空間を自動生成する機能を搭載。
物理演算とキャラクター操作モードの実装
生成された空間内でキャラクターの移動や物理衝突判定が可能になり、制限なく探索できる「遊べる」環境を構築できる。
実世界シーンの高精度復元とデジタルツイン応用
WorldMirror 2.0アーキテクチャを用い、実写動画や多視点画像から高密度点云や深度図を一次性予測し、建築・都市計画などのデジタルツイン構築に活用可能。
3DGSとMeshのハイブリッド表現
キャラクターモードでの物理衝突インタラクションを実現し、高品質なメッシュデータとしてUnityやUEなどの主流ゲームエンジンへシームレスにエクスポート可能。
カメラパラメータ不要のパノラマ生成
HY-Pano-2.0モデルにより、単一画像からエンドツーエンドで360度パノラマを生成。実写とUE合成データの混合学習により高品質な汎化能力を実現。
空間エージェントと世界拡張技術
VLMとnavmeshを組み合わせた空間エージェントが意味のある移動経路を自動計画。HY-WorldStereoによる空間一貫性メモリと精密なカメラ制御で、自然な3D世界探索を実現。
影響分析・編集コメントを表示
影響分析
本リリースはAIGCの分野において「動画生成」から「編集可能な3D空間構築」へのパラダイムシフトを明確に示しており、ゲーム開発や具身AIの学習環境構築における作業効率を飛躍的に向上させる。オープンソース化によりコミュニティ主導での改良と標準パイプラインへの組み込みが加速すれば、クリエイターと開発者の間で新たな業界基準となる可能性がある。ただし、大規模シーンでのパフォーマンス安定性や物理演算の精度は実運用環境での検証が不可欠である。
編集コメント
動画生成モデルから3D資産生成へ移行する流れは、ゲーム開発やメタバース構築の現実的なボトルネックを解決する重要な一歩である。オープンソース化によりコミュニティ主導での改良が進めば、標準パイプラインへの組み込みが加速する可能性が高い。
テンセント混元 2026-04-16 10:31 広東省
オープンソース化(Open Source)
今日、混元3D世界モデル2.0(HY-World 2.0)が正式にリリースされ、オープンソース化されました。
HY-World 2.0はマルチモーダルなワールドモデル(World Model)であり、テキスト、画像、動画などの異なる種類の入力に基づいて3D世界を自動的に生成・再構築・シミュレートできます。また、複数の形式の3Dアセット(メッシュ/Mesh、3DGS、ポイントクラウド/Point Cloudなど)のエクスポートに対応し、既存のゲームワークフロー(Game Workflow)とシームレスに連携して、ゲームマップやレベルのプロトタイプを迅速に生成できます。
混元ワールドモデル2.0により、AIは「対話」「描画」「物体の作成」から、「世界構築」へと進化しました。人物、物体、風景を含む完全な「世界」を生成します。
これまでの主流のワールドモデル(例:Google Genie 3や混元ワールドモデル1.5)は動画ファイルの生成のみが可能でしたが、今回リリースされた2.0は実用性がさらに向上し、直接編集可能な3Dアセットファイルを生成できます。さらに、これらの生成された3Dアセットはゲーム制作や具身シミュレーションエンジン(Embodied Simulation Engine)に直接インポートでき、真の意味でプレイ可能かつ実用的なコンテンツを実現します。
モデルの体験申請が開放されました。リンク:https://3d.hunyuan.tencent.com/sceneTo3D
実機デモ:「中世ファンタジーRPG風のダンジョンを生成」と入力するだけで、3D空間アセットが生成されます。
実機デモ:「温かみのある絵本風の木造家屋を生成」と入力すると、ゲームキャラクターが生成された3D空間内を自由に移動できます。
上記の画像内容はすべて3Dファイルであり、HY-World 2.0 AI大モデルによるワンクリック生成です。
マルチモーダル入力に対応。スケッチからマップへ、画像から空間へ
混元ワールドモデル2.0はテキスト、画像、動画のマルチモーダル入力に対応しています。
テキストや画像を入力すると、モデルは複雑な意味を正確に解析し、ワンクリックで多様なスタイルの探索可能な世界を生成します。混元ワールドモデル1.0と比較して、2.0のモデルアーキテクチャが全面的にアップグレードされ、画質の細密さとリアリティが大幅に向上しました。ユーザーはスタイルをカスタマイズでき、リアル風、漫画風、ゲーム風の3D空間を必要に応じて生成できます。生成後、アセットをUnityやUE(Unreal Engine)などのエンジンにインポートして二次編集を行うことができ、ゲームマップの制作ハードルを大幅に低下させます。
また、モデルはキャラクターモードにも対応しており、ユーザーはキャラクターを操作して街路、建築物、シーン内を自由に探索できます。時間制限はなく物理衝突判定があり、まるでゲーム内のようになっています。
上記の画像内容はすべて3Dファイルであり、HY-World 2.0 AI大モデルによるワンクリック生成です。
さらに、ワールドモデル2.0は実際の3Dシーンの復元にも対応しています。ユーザーが実空間の動画やマルチアングル画像を入力すると、モデルは高精度なデジタルツイン(Digital Twin)空間を構築します。アップグレードされたWorldMirror 2.0アーキテクチャに基づき、任意のサイズ画像と動画入力に対応し、高密度ポイントクラウド(Dense Point Cloud)、マルチアングル深度マップ(Multi-view Depth Map)、表面法線(Surface Normal)、カメラパラメータを一度に予測します。一度生成すれば永久に再利用可能で、将来的には室内インテリアのプレビュー、都市計画、文化財保護などのシーンにおいて、この能力に基づいて迅速な構築と復元が可能になります。
他社の世界モデルと比較して、混元世界モデル2.0は、シーン完全性(物体の側面や背面を含む)および入力画像への追従性においてより優れたパフォーマンスを発揮します。混元が生成する3D高斯スプレー(3DGS: 3D Gaussian Splatting)とメッシュ(Mesh)のハイブリッド表現により、ユーザーはキャラクターモードを有効化し、現実的な物体との衝突を伴うインタラクティブな操作を行うことができます。
3D生成を中核に据え、空間の理解・生成・再構築を統一
混元世界モデル2.0は3D生成を中核とし、空間の理解・生成・再構築を統一するアーキテクチャを通じて、最先端技術レベル(SOTA: State of the Art)クラスの生成効果を実現しました。
従来の手法では、パノラマ画像を生成するために正確なカメラパラメータが必要ですが、現実の環境ではこれらのパラメータを取得できないことが往々にしてあります。
HY-World 2.0はHY-Pano-2.0モデルを大幅にアップグレードし、エンドツーエンドの暗黙的学習アプローチを採用しました。これにより、モデルは通常の画像から360度パノラマへの空間マッピングを自律的に学習し、カメラパラメータは一切不要となります。さらに、チームの実際のパノラマ写真とUE(Unreal Engine)エンジン合成データの混合学習戦略を組み合わせることで、生成品質と汎化能力を保証しています。
パノラマ画像が完成した次は、「どのように移動するか」の計画です。
チーム独自開発の空間エージェント技術を用い、ビジョン・ランゲージモデル(VLM: Vision-Language Model)とゲームの自動経路探索アルゴリズムで一般的に用いられるナビメッシュ(navmesh)表現を組み合わせることで、大規模モデルが空間の意味を理解し、有意義な散策軌道をインテリジェントに計画できるようになります。これにより、シーン内で最も価値の高い領域を確実にカバーしつつ、壁の貫通や軌道からの逸脱を防ぎます。モデルは各シーンの異なる意味付けに基づき、「物体の周回」「最大散策」など5種類のカメラ軌道を計画し、これに続く世界拡張モデルと組み合わせることで、ユーザーが3D世界を探索する経路を自然かつ面白くします。
計画された軌道に沿って、モデルは動画生成技術を用いて世界を絶えず「拡張」していきます。
このステップの鍵となる革新は、「精密なカメラ制御+細粒度の視覚的詳細保持+空間一貫性メモリ機構」にあり、この一連のプロセスにより、新たに生成された領域と既存の領域が幾何学的・視覚的に完璧に接続され、不自然な切り替えが生じません。メモリ機構の設計と体系的な中間学習・後学習(post-training)を通じて、チームは現在業界最強の新視点生成(NVS: New View Synthesis)モデルであるHY-WorldStereoを構築しました。生成画像は入力カメラの動きに精密に従い、複数のカメラ軌道による生成結果も空間的に一貫しており競合しません。後学習アルゴリズムの設計により、高速な生成を維持しつつ画質の劣化を防いでいます。
最後に、HY-WorldMirror 2.0を用いて生成されたすべての断片を統合し、統一されインタラクティブな3D世界へと結合します。カスタマイズされた深度アライメント(Depth alignment)と適応型Mask gaussianシーン最適化アルゴリズムを採用し、生成されたシーンは3D高斯スプレー(3D Gaussian Splatting)で表現されます。同時に高品質なメッシュへの変換も可能であり、UnityやUEなどの主流ゲームエンジンへのシームレスなエクスポートをサポートし、二次編集や創作に対応しています。
混元世界模型(HY-World シリーズ)は公開以来進化を続けており、初のオープンソース3D空間モデル(3D World Model)「HY-World 1.0」から、リアルタイムのオンラインインタラクションに対応する「HY-World 1.5」、さらにワンクリックで高品質な完全な3D空間アセットを生成する「HY-World 2.0」へと至るまで、腾讯混元の3D空間モデルは「AIによる世界構築(AI World Creation)」を概念から現実へと一歩ずつ近づけています。
体験申込:https://3d.hunyuan.tencent.com/sceneTo3D
オープンソースコード:https://github.com/Tencent-Hunyuan/HY-World-2.0
技術レポート:https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf
原文を読む
WeChatで開くにはこちら
原文を表示
腾讯混元 2026-04-16 10:31 广东
image
开源
今天,混元3D世界模型 2.0(HY-World 2.0)正式发布并开源。
HY-World2.0是一个多模态世界模型,能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟 3D 世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,支持与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。
混元世界模型 2.0让 AI 从“对话”、"画图"、“捏物体”,进化到了“造世界”——生成包含人、物、景的完整“世界”。
此前主流的世界模型,例如谷歌Genie 3和混元世界模型1.5,仅能生成视频文件,本次发布的世界模型2.0的实用性更进一步——它可以直接生成可二次编辑的3D资产文件,并且,这些生成的3D资产可以直接导入到游戏制作或者具身仿真引擎,实现真正可玩、可用。
模型已开放申请体验,链接:https://3d.hunyuan.tencent.com/sceneTo3D
实机演示:输入“生成一个日式RPG风格的中世纪地牢”,即可生成一个3D空间资产
实机演示:输入“生成一个温馨的绘本风格小木屋”,游戏角色可以自由穿行在生成的3D场景中
上图所有内容均为3D文件,且全部由HY-World 2.0 AI大模型一键生成
支持多种模态输入,草图变地图、图片变空间
混元世界模型2.0支持文、图、视频多种输入。
输入一段文字或一张图片,模型即可精准解析复杂语义,一键生成风格多样的可漫游世界。相比较混元世界模型1.0,2.0的模型架构全面升级,画面精细度和真实感大幅提升。用户还可以自定义风格,按需生成真实风、漫画风、游戏风的3D空间。生成完成后,用户可以将资产导入到Unity、UE 等引擎、进行二次编辑,显著降低了游戏地图的创作门槛。
模型还支持角色模式,用户可以操作角色在街道、建筑、场景中自由探索,不限时间,具有物理碰撞,就像在游戏里一样。
以上图片内容均为3D文件,且全部由HY-World 2.0 AI大模型一键生成
同时,世界模型2.0支持复刻真实3D场景,用户输入一段真实空间的视频或者多视角图片,模型就能构建出高精度的数字孪生空间。基于升级后的 WorldMirror 2.0 架构,模型支持任意尺寸图像与视频输入,一次性预测密集点云、多视角深度图、表面法线及相机参数 ,一次生成永久可复用。未来,室内装修预览、城市规划、文化遗产保护等场景,都可以基于这一能力实现快速构建和还原。
与其他世界模型相比,混元世界模型2.0在场景完整度(物体侧面和背面)以及对输入图片的遵循程度表现更优。混元生成的3DGS与Mesh的混合表征,也让用户能够开启角色模式进行有真实物体碰撞的交互。
以3D生成为主轴,统一空间理解、生成、重建
混元世界模型2.0以3D为主轴,通过统一空间理解、生成、重建的架构,实现了SOTA级的生成效果。
传统方法需要精确的相机参数才能生成全景图,但现实中这些参数往往拿不到。
HY-World 2.0 全新升级HY-Pano-2.0模型, 采用端到端隐式学习方案,让模型自己学会从普通图片到 360 度全景的空间映射,完全不需要任何相机元数。再配合团队的真实全景照片和 UE 引擎合成数据的混合训练策略,保证了生成质量和泛化能力。
有了全景图,下一步是规划“怎么走”。
通过团队自研的空间Agent技术,结合VLM与游戏自动寻路算法常用的navmesh表征,让大模型能够理解空间语义,并智能规划出有意义的漫游轨迹,确保覆盖场景中最有价值的区域,同时避免穿墙、跑飞。模型会根据每个场景的不同语义,规划出“环绕物体”、“最大漫游”等五类运镜轨迹,这样搭配下一步的世界扩展模型,可以让用户在 3D 世界中的探索路径既自然又有趣。
沿着规划好的轨迹,模型通过视频生成技术不断“扩展”世界。
这一步的关键创新在于“精确的相机控制 + 细粒度视觉细节保持 + 空间一致性记忆机制”,这一套流程可以确保新生成的区域与已有区域在几何和视觉上完美衔接,不会“穿帮”。通过记忆力机制的设计以及体系化的中间训练和后训练,团队打造了目前业界最强的新视角生成(NVS)模型HY-WorldStereo。生成画面对输入相机的精准跟随,且多条运镜的生成结果保持空间一致不会有冲突;通过后训练算法的设计,使得保持快速生成的同时画面质量不会衰减。
最后,将所有生成的片段通过HY-WorldMirror 2.0 整合为一个统一的、可交互的 3D 世界。使用定制的Depth alignment和自适应Mask gaussian场景优化算法,生成的场景采用 3D 高斯泼溅(3DGS)表示,同时可以转出高质量mesh,可以无缝导出到 Unity/UE 等主流游戏引擎,支持二次编辑和创作。
混元世界模型(HY-World 系列)自发布以来就在持续进化:从首个开源的3D世界模型 HY-World 1.0 ,到可实时在线交互的 HY-World 1.5 ,再到一键生成高质量完整3D空间资产的 HY-World 2.0,腾讯混元的3D世界模型正在一步步将“AI造世界”从概念变为现实。
申请体验:https://3d.hunyuan.tencent.com/sceneTo3D
开源代码:https://github.com/Tencent-Hunyuan/HY-World-2.0
技术报告:https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf
阅读原文
跳转微信打开
関連記事
Seed3D 2.0リリース、高精度化と可用性の向上
字节跳动Seedチームは2026年4月、3D生成モデル「Seed3D 2.0」を公開した。幾何形状とテクスチャ生成でSOTA性能を達成し、高精度化と可用性の向上を実現した。
「ハムラジオを持つアライグマはどこ?(ChatGPT Images 2.0)」
OpenAIは画像生成モデル「ChatGPT Images 2.0」を公開した。サム・アルトマンCEOは性能向上をGPT-3からGPT-5の飛躍と評価し、筆者はテストした。
RobloxのAIアシスタントが、ゲームを計画・構築・テストするための新しい自律的ツールを獲得
Robloxが、AIアシスタントにゲーム開発プロセス全体を支援する新しい自律的ツールを追加した。