読み込み中…

字节跳动Seed·2026年4月23日 13:23·約13分

Seed3D 2.0リリース、高精度化と可用性の向上

#3D生成 #DiTアーキテクチャ #PBRマテリアル #具身知能 #火山エンジン

TL;DR

字节跳动Seedチームは、複雑な構造と物理的に一貫したPBRマテリアルを生成するSeed3D 2.0を公開し、3D生成モデルの実用化を加速させた。

AI深層分析2026年4月23日 18:23

重要/ 5段階

深度40%

キーポイント

幾何生成の二段階DiTアーキテクチャ導入

Coarse-to-Fine戦略で全体構造と細部を解耦し、鋭利なエッジや複雑トポロジーの生成精度を大幅に向上させた。

統一PBRマテリアルモデルによる物理的一貫性の確保

従来の級聯式RGB生成とPBR分解の誤差累積を解消し、任意光照条件下でも物理的に正確な質感表現を実現。

VAEアーキテクチャの最適化とAPI公開

トークン削減による高精度・高速推論を実現し、技術レポートとAPIを火山エンジン経由で一般提供開始。

人間評価によるSOTA実証

60人の専門評価員による盲検比較テストで、幾何形状生成において既存主要モデルを上回る高い偏好率を確認。

统一PBR架构与双核心创新

摒弃级联式模型，采用统一PBR生成架构；结合MoE架构提升高分辨率细节与边界精度，并引入VLM先验增强未知光照下的材质分解稳定性。

生成质量显著提升

在真实度、材质质量与文字渲染等维度全面优于基线，人类偏好率突破69%。

部件级生成与关节化建模拓展

采用“先理解，再生成”范式实现功能部件拆分与补全，结合运动学识别与物理仿真兼容输出（URDF格式），支持交互式与仿真下游应用。

重要な引用

几何及纹理材质生成均达 SOTA 表现

Seed3D 2.0 的改进思路是，引入 Coarse-to-Fine 两阶段生成策略，把“整体结构”和“几何细节”解耦

完整的 PBR 材质才能确保 3D 内容在任意光照条件下保持物理一致的视觉效果

目前 Seed3D 2.0 技术报告已公开，API 也已上线火山引擎

采用 MoE 架构，提升高分辨率材质的细节与边界精度。...引入 VLM 先验，增强未知光照下的材质分解稳定性与准确性。

Seed3D 2.0 采用“先理解，再生成”的范式...最终模型可输出带有完整关节信息、以 URDF 等标准格式呈现的 3D 内容，实现与 Isaac Sim 等主流物理仿真引擎的兼容。

影響分析・編集コメントを表示

影響分析

Seed3D 2.0の公開は、生成AIが単なる視覚的な模倣から「生産可能な工業・具身知能レベル」へ移行する転換点を示している。幾何精度と物理的に正確なPBRマテリアルを同時に実現したことで、3Dコンテンツ制作のボトルネックが解消され、ゲーム開発や製造業のプロトタイピングにおけるコストと時間削減に直接寄与する。

編集コメント

技術レポートの公開とAPI提供により、生成AIが単なる視覚コンテンツ作成から「生産可能な工業・具身知能インフラ」へ移行する明確な兆候を示している。アーキテクチャの最適化により推論効率と品質が両立したため、今後はゲーム開発や製造業のプロトタイピングにおける標準ツールとして普及が進むと予想される。

原作：ByteDance Seed 2026-04-23 12:23 北京

image

幾何形状およびテクスチャマテリアルの生成においてSOTA（State of the Art）の性能を達成

image

高品質かつ大規模な3Dコンテンツは、具身知能（Embodied AI）や工業製造などの分野において重要なインフラとなりつつありますが、従来の手法で生成された3Dコンテンツは、幾何精度やマテリアルのリアリティなどの面で、まだ生産レベルの要件を満たすのが難しい状況です。

昨年、Seed3D 1.0は単一画像から高品質な3Dモデルへのエンドツーエンド生成を探求し、テクスチャ生成において突破を遂げました。本日、私たちはより高精度な新世代の3D生成大モデル「Seed3D 2.0」を正式にリリースします。チームは幾何精度とマテリアル品質を中心にモデルのアーキテクチャをアップグレードし、3Dコンテンツのダウンストリームでの利用可能性を拡張しました。これにより、3D生成が「実用レベル」へと一層推進されることを期待しています。

既存の3D生成モデルとの比較評価において、Seed3D 2.0は幾何形状生成とテクスチャマテリアル生成という2つの核心指標でともにSOTA（State of the Art）の結果を達成しました。モデルは複雑な構造の再現がより精緻になり、PBR（Physically Based Rendering）マテリアルの生成においても、より高いリアリティと安定性を備えています。

現在、Seed3D 2.0の技術レポートが公開されており、APIも火山エンジン（Volcengine）で利用可能になりました。プロジェクトのホームページにアクセスしてご確認いただけますので、ぜひ体験と意見交換をお待ちしています。

プロジェクトホームページ：

https://seed.bytedance.com/seed3d_2_0

体験エントリ：

火山方舟（Volcano Ark）体験センター - ログイン - 視覚モデルの選択 - 3D生成 - Doubao - Seed3D-2.0

幾何形状生成：2段階DiT（Diffusion Transformer）の導入、構造の妥当性から詳細の信頼性へ

3Dコンテンツ生成における幾何形状とテクスチャの品質は、モデルの実用性を決定する2つの核心次元です。そのうち幾何形状の品質は物体構造が妥当かどうかを直接決定し、生成コンテンツが「実用可能」か「不可能」かを分ける重要な分水嶺となります。Seed3D 1.0では、モデルが「全体構造」と「詳細構造」の生成を同時に行う必要があり、この方式は物体の全体形状を迅速に捉えることができますが、鋭いエッジや詳細構造において「軟化」現象が発生しやすく、生成された辺が十分に直線的でなかったり、曲面が十分に正確でなかったりする可能性があります。

image

Seed3D 2.0の幾何形状生成の完全なフロー

Seed3D 2.0の改善アプローチは、Coarse-to-Fine（粗から細へ）の2段階生成戦略を導入し、「全体構造」と「幾何詳細」をデカップリングして個別に最適化することで、鋭いエッジ、薄肉構造、複雑なトポロジーといった幾何形状生成の難関に突破することです：

段階1：粗い幾何構造の生成。モデルはより大規模なパラメータを持つDiTを活用し、入力画像に基づいて粗粒度の幾何構造を生成し、全体のトポロジー関係と空間レイアウトを構築します。

段階2：高精度詳細の生成。モデルは段階1の出力を幾何アンカーとして利用し、鋭いエッジや精密な表面などの詳細復元に焦点を当てます。ここで2つの重要な事前知識（Prior）を導入します：

局所知覚事前知識：第1段階の粗い結果を潜在変数に変換し、後続の詳細生成に対して信頼性の高い初期化入力を提供し、「空中生成」に起因する不安定さを回避します。

ボクセル化位置エンコーディング：第1段階で生成された幾何表面上に点をサンプリングし、ボクセル化処理を施して位置エンコーディングとし、モデルに対して空間位置の制約を提供します。

さらに、Seed3D 2.0はVAE（Variational Autoencoder）側でも同期アップグレードを実施し、より少ないトークンでより高い再構築精度を実現しました。局所領域の詳細表現を強化し、コンテンツに応じて注意機構（Attention）を動的に割り当てることで、VAEモデルの再構築精度と推論効率を大幅に向上させました。

図に示すように、既存の主流3D生成モデルとの定性的比較结果表明、Seed3D 2.0は複雑構造の精密エッジの処理、薄肉構造の生成、入力画像の再現において、ベースライン手法を明らかに上回っています。

image

幾何形状次元の定性的比較

さらに、3Dモデリングの経験を持つ60名の人間評価者を募集し、約200のテストケースを対象に、Seed3D 2.0と6つの主流モデルの生成品質をペアごとの盲検評価で比較しました。Seed3D 2.0は幾何形状生成の比較テストにおいて顕著な優位性を示し、他のすべての3D生成モデルと比較して高い選好率（人間評価者がその生成品質をより優れていると判断した割合）を示し、アーキテクチャの革新がもたらす幾何品質の向上を検証しました。

image

純粋な幾何形状生成タスクにおいて、ユーザーがSeed3D 2.0を主流モデルよりも優れていると評価した割合

テクスチャ生成：統一PBRモデル、外観の類似から物理的一貫性へ

幾何構造の精度に加え、テクスチャマテリアルのリアリティも3Dコンテンツの品質を直接決定します。特にダウンストリームアプリケーションでは、RGB（Red Green Blue）の外観だけでは不十分であり、完全なPBRマテリアルによってのみ、3Dコンテンツが任意の照明条件下でも物理的に一貫した視覚効果を保証できます。

Seed3D 1.0は、RGB生成とPBR（Physically Based Rendering：物理ベースレンダリング）分解にカスケード型モデルを採用しており、中間ステップの誤差が段階的に蓄積し、最終的な材質品質に影響を及ぼしていました。Seed3D 2.0では、これを統一されたPBR生成モデルに簡素化し、MMDiT（Multi-Modal DiT：マルチモーダルDiT）の二流アーキテクチャを維持したまま、モダリティ固有の投影層を通じて、共有DiT層内で完全なPBRマップを統合的にモデル化可能にしました。

image

Seed3D 2.0のテクスチャ生成フロー

統一された生成アーキテクチャを基盤とし、さらに2つの重要な革新を導入することで、より高解像度における高精度な材質生成を実現しました。

MoE（Mixture of Experts：エキスパートの混合）アーキテクチャを採用し、高解像度材質の詳細と境界精度を向上させました。Seed3D 1.0は出力解像度の制約により材質分解の詳細を保持しにくく、モデルのパラメータ数と解像度を直接拡大すると計算コストが高すぎるという課題がありました。そのためMoEアーキテクチャを採用し、スパースなエキスパートルーティングにより、モデルのパラメータ数と解像度を拡大しつつ推論計算量を制御し、より豊かなテクスチャ詳細と高精度な金属度・粗さの境界を生成可能にしました。

VLM（Vision-Language Model：ビジョン・ランゲージモデル）の事前知識を導入し、未知の照明下での材質分解の安定性と正確性を強化しました。RGB画像からPBR材質を逆算することは業界の難題であり、同じ外観でも異なる材質と照明の組み合わせによって生じる可能性があり、モデル推論時には色調の偏りや金属度の誤判定などのエラーが頻発します。これを解決するため、VLMモデルを入力画像の材質タイプと物理属性の説明に用い、追加の制御信号としてDiTに注入することで、材質分解をより安定かつ合理的なものにしました。

テクスチャ材質生成の定性的比較において、Seed3D 2.0は生成のリアリティ、材質品質、視覚的詳細、テキストレンダリングなどのすべての次元でベースライン手法を上回っています。

例えば、ステンレス製の鍋という物体において、Seed3D 2.0の生成結果はより現実的な金属質感を示しています。表面反射には適度な粗さの変化があり、わずかな使用感も伴い、ハイライトの分布が自然で、部位間での材質表現が一貫しています。一方、他の手法では材質が均一になりすぎたり全体に暗くなったりしやすく、実物体に見られる微細な変化が欠如しやすいという課題があります。

image

テクスチャ生成次元の定性的比較

テクスチャ3Dコンテンツ生成における人間の評価スコアにおいても、Seed3D 2.0は他のベースライン手法をリードしており、現在業界で主流のモデルと比較しても、Seed3D 2.0への選好率は69%以上を記録しています。

image

テクスチャ生成タスクにおいて、ユーザーがSeed3D 2.0を他のベースラインモデルより優れていると評価した割合

Seed3D 2.0の応用タスク探求：部品レベル生成とシーン組み合わせ

多くの応用シーンでは、完全な3D物体を機能的な部品に分解する必要があります。例えば、インタラクティブシステムでは独立して操作可能な物体コンポーネントが必要であり、シミュレーション環境では関節運動が可能な部品構造が必要です。そのため、Seed3D 2.0はモデリングの柔軟性をさらに拡張し、構成部品を「自在に分離・結合」できることを実現しました。

image

部品レベル3Dコンテンツ生成フローの概要

Seed3D 2.0は「まず理解し、その後生成する」というパラダイムを採用し、複雑な部品生成フローを2つのステップに分解しました。生成された3Dコンテンツに対してまず部品レベルでの分割を行い、その後各部品の完全な形状を補完します。

まず、Seed3D 2.0は大量の特定の分割データを収集・注釈付けすることで、3Dデータ上で機能性などの次元に基づいてどのように分割するかを学習します。私たちはSeed3D-PartSegの3D理解モジュールを訓練し、完全な3Dメッシュに対する表面分割を実現可能にしました。この基盤之上、Seed3D-PartDiTはさらにグローバルな3D形状、分割されたポイントクラウド、および画像を入力として生成ネットワークを訓練し、最終的に表面の分割結果を補完して完全な部品化メッシュに組み立てます。

図に示す通り、椅子はモデルによって自動的に座面、背もたれ、台座に分割され、ロボットも手足などの部位ごとに細かく分解されます。この部品スケールでの表現は、その後の詳細なインタラクション操作の基盤となります。

image

独立した部品には、意味のあるインタラクションを生成するために適切な物理的接続が必要です。そのため、部品の分割を基盤としつつ、Seed3D 2.0はさらにジョイント化モデリング能力を導入しました。

このプロセスはマルチモーダル理解と生成技術を融合しています。モデルはまずVLMを用いて部品を運動学コンポーネントに分割し、ジョイントタイプ（「回転可能な部品」や「固定構造」など）を識別します。さらに幾何学的事前知識と組み合わせてジョイント軸の位置を推定します。運動の物理的妥当性を確保するため、モデルはさらに画像から動画生成（Image-to-Video）モデルを用いて運動参照を生成し、ジョイント部品の動作範囲を最適化します。最終的にモデルは、完全なジョイント情報を含む3DコンテンツをURDFなどの標準フォーマットで出力し、Isaac Simをはじめとする主流の物理シミュレーションエンジンとの互換性を実現します。

image

現実の物理世界は多くの物体が織りなすものであり、そのためSeed3D 2.0は単一オブジェクトの生成能力からシーン（場面）生成へと拡張しました。

image

適切なオブジェクト配置を実現するため、Seed3D 2.0は入力条件に応じてレイアウト戦略をインテリジェントに適応させます。テキスト入力の場合、ファインチューニングされた大規模言語モデル（Large Language Model, LLM）を用いて空間関係の推論とレイアウト生成を行います。マルチビュー画像や動画入力の場合、モデルは深度推定（Depth Estimation）などの視覚シグナルに加え、インスタンスセグメンテーション（Instance Segmentation）やオクルージョン修復（Occlusion Repair）などの能力を活用して、シーンの空間レイアウトを推論します。レイアウトを取得した後、Seed3D 2.0は3Dコンテンツを一つずつ生成し、空間関係に従って組み合わせることで、豊かで完全なシーンを構築します。

image

Seed3D 2.0のシミュレーションシーン生成フロー

さらに、前述のパーツレベル生成とジョイント化（関節付け）能力を組み合わせることで、Seed3D 2.0が最終的に生成するシーンは厳密な空間構造を持つだけでなく、その中のオブジェクトは物理的な相互作用をサポートするジョイント化された3Dコンテンツに変換可能となります。これにより、下流の物理シミュレーション用途への基盤が築かれます。

まとめと展望

Seed3D 2.0は幾何精度、PBR（Physically Based Rendering）マテリアルの品質、そして下流での実用性において顕著な進歩を遂げました。しかしながら、3D生成はいくつかの長期的な課題に直面し続けています。幾何生成の詳細度と汎化性能には改善の余地があり、テクスチャ生成ではオクルージョン（遮蔽）やマッピング誤差の問題が残っています。また、3D生成モデルの大規模な適用は推論効率によって制限されており、その実装シーンには未知の領域と探求の余地が残っています。今後、これらの方向性で引き続き研究を深化させ、3D生成技術がより多くのシーンで大規模に適用されるよう推進してまいります。

image

阅读原文

跳转微信打开

原文を表示

原创字节跳动Seed 2026-04-23 12:23 北京

image

几何及纹理材质生成均达 SOTA 表现

image

高质量且大规模的 3D 内容正成为具身智能、工业制造等领域的关键基础设施，但此前方法生成的 3D 内容在几何精度、材质真实性等方面，仍难达到生产级要求。

去年，Seed3D 1.0 探索了从单张图像到高质量 3D 模型的端到端生成，并在纹理生成方面取得突破。今天，我们正式发布更高精度的新一代 3D 生成大模型——Seed3D 2.0。团队围绕几何精度和材质质量对模型进行了架构升级，并拓展了 3D 内容的下游可用性，期望进一步推动 3D 生成迈向“生产可用”。

在与现有 3D 生成模型的对比评测中，Seed3D 2.0 在几何生成、纹理材质生成两项核心指标上均取得 SOTA 结果。模型对复杂结构的还原更加精细，PBR 材质的生成也具有更强的真实感和稳定性。

目前 Seed3D 2.0 技术报告已公开，API 也已上线火山引擎，可访问项目主页查看，欢迎体验和交流。

项目主页：

https://seed.bytedance.com/seed3d_2_0

体验入口：

火山方舟体验中心-登录-选择视觉模型-3D生成-Doubao-Seed3D-2.0

几何生成：引入两阶段 DiT，从结构合理到细节可靠

3D 内容生成的几何和纹理质量，是决定模型可用性的两大核心维度。其中，几何质量直接决定了物体结构是否合理，是区分生成内容“可用”与“不可用”的关键分水岭。在 Seed3D 1.0 中，模型需要同时完成“整体结构”和“精细结构”的生成，这种方式虽能较快捕获物体整体形状，但在锐利边缘和精细结构上可能存在“软化”现象，导致生成的边不够笔直、曲面不够精准。

Seed3D 2.0 几何生成的完整流程

Seed3D 2.0 的改进思路是，引入 Coarse-to-Fine 两阶段生成策略，把“整体结构”和“几何细节”解耦，分开优化，从而在锐利边缘、薄壁结构和复杂拓扑等几何生成难点上取得突破：

阶段一：粗糙几何结构生成。模型利用更大参数规模的 DiT，基于输入图像生成粗粒度的几何结构，建立整体的拓扑关系和空间布局。

阶段二：高精度细节生成。模型以阶段一的输出作为几何锚点，专注于锐利边缘、精细表面等细节恢复，其中引入两种关键先验：

局部感知先验：将第一阶段的粗糙结果转化为隐变量，为后续的细节生成提供可靠的初始化输入，避免“凭空生成”带来的不稳定。

体素化位置编码：在第一阶段生成的几何表面采点，并进行体素化处理，作为位置编码为模型提供空间位置约束。

此外，Seed3D 2.0 在 VAE 侧做了同步升级，更少 token 即可获得更高的重建精度。通过增强局部区域的细节表达，并根据内容动态分配注意力，我们大幅提升了 VAE 模型的重建精度和推理效率。

如下图所示，与现有主流 3D 生成模型的定性对比表明，Seed3D 2.0 在处理复杂结构的精细边缘、生成薄壁结构和还原输入图像方面明显优于基线方法。

几何生成维度的定性对比

此外，我们招募了 60 位具有 3D 建模经验的人类打分员，针对约 200 个测试用例，对 Seed3D 2.0 和六个主流模型的生成质量进行两两盲评对比。Seed3D 2.0 在几何形状生成的对比测试中展现出显著优势，相比所有其他 3D 生成模型呈现更高的偏好率（人类打分员认为其生成质量更优的比例），验证了架构创新带来的几何质量提升。

在纯几何生成任务中，用户认为 Seed3D 2.0 相比主流模型更优的比例

纹理生成：统一 PBR 模型，从外观相似到物理一致

除了几何结构的精度，纹理材质的真实感也直接决定了 3D 内容的质量。尤其是在下游应用中，仅有 RGB 外观远远不够，完整的 PBR 材质才能确保 3D 内容在任意光照条件下保持物理一致的视觉效果。

Seed3D 1.0 采用了级联式模型进行 RGB 生成和 PBR 分解，中间步骤的误差会逐级累积，影响最终材质质量。在 Seed3D 2.0 中，我们将其简化为统一的 PBR 生成模型，保持 MMDiT 双流架构，通过模态特定投影层，即可在共享 DiT 层中联合建模完整 PBR 贴图。

Seed3D 2.0 的纹理生成流程

我们在统一的生成架构基础上，还引入两项关键创新，实现了更高分辨率下的精准材质生成：

采用 MoE 架构，提升高分辨率材质的细节与边界精度。Seed3D 1.0 受限于输出分辨率，难以保留材质分解中的细节，而直接扩大模型参数量和分辨率的计算开销过高。因此我们采用 MoE 架构，通过稀疏专家路由，在扩大模型参数量和分辨率的同时控制推理计算量，使模型能生成更丰富的纹理细节和更精确的金属-粗糙度边界。

引入 VLM 先验，增强未知光照下的材质分解稳定性与准确性。从 RGB 图像逆向推导 PBR 材质是一个行业难题：相同的外观，可能由不同的材质与光照组合产生，模型推理时经常出现色偏、金属性误判等错误。为此，我们引入 VLM 模型对输入图片的材质类型和物理属性进行描述，并作为额外控制信号注入 DiT 中，让材质分解更加稳定且合理。

纹理材质生成的定性对比中，Seed3D 2.0 在生成真实度、材质质量、视觉细节和文字渲染等维度上均优于基线方法。

例如，在不锈钢锅这一物体上，Seed3D 2.0 的生成结果呈现出更接近真实的金属质感：表面反射具有一定粗糙度变化，并伴随轻微使用痕迹，高光分布自然，不同部位之间的材质表现保持一致。相比之下，其他方法易出现材质过于均匀或整体偏暗的情况，缺乏真实物体中的细微变化。

纹理生成维度的定性对比

在纹理 3D 内容生成的人类打分中，Seed3D 2.0 同样领先其他基线方法，面对目前行业内主流模型，Seed3D 2.0 的偏好率达到 69% 以上。

在纹理生成任务中，用户认为 Seed3D 2.0 相比其他基线模型更优的比例

Seed3D 2.0 下游任务探索：部件级生成与场景组合

在许多下游场景中，完整的 3D 物体需被拆解为功能性部件，例如在交互式系统中需要可独立操控的物体组件，仿真环境中需要可关节化运动的部件结构。因此，Seed3D 2.0 进一步拓展了建模的灵活性，可实现组成部件“分合自如”。

部件级 3D 内容生成流程概览

Seed3D 2.0 采用“先理解，再生成”的范式，将复杂的部件生成流程分解成两步：对生成的 3D 内容先进行部件级的拆分，然后补全每个部件的完整形状。

首先，Seed3D 2.0 通过收集和标注大量特定的分割数据，来学习如何在 3D 数据上根据功能性等维度进行拆分。我们训练了 Seed3D-PartSeg 的 3D 理解模块，可对完整 3D 网格进行表面分割。在此基础上，Seed3D-PartDiT 进一步以全局 3D 形状、分割点云和图像为输入，训练生成网络，最终把表面拆分结果补全并组合为完整的部件化网格。

如下图所示，一把椅子会被模型自动拆分为座椅、靠背和底座；机器人也被按照四肢等部位精细拆解。这种部件尺度下的表征，为后续的精细交互操作提供了基础。

独立的部件需要正确的物理连接才能产生有意义的交互。因此在部件分割的基础上，Seed3D 2.0 进一步引入了关节化建模能力。

这一过程融合了多模态理解与生成技术。模型首先利用 VLM 把部件拆分为运动学组件，并识别关节类型（如“可旋转部件”或“固定结构”），再结合几何先验估计关节轴位置。为确保运动的物理合理性，模型还引入图生视频模型生成运动参考，以优化关节部件的运动范围，最终模型可输出带有完整关节信息、以 URDF 等标准格式呈现的 3D 内容，实现与 Isaac Sim 等主流物理仿真引擎的兼容。

真实的物理世界是由众多物体交织而成的，因此，Seed3D 2.0 还将单一物体生成能力拓展至场景生成。

为实现合理的对象排列，Seed3D 2.0 选择根据不同的输入条件智能适配布局策略：对于文本输入，利用微调过的 LLM 进行空间关系推理和布局生成；对于多视角图片或视频输入，模型额外利用深度估计等视觉信号，以及实例分割和遮挡修复等能力，来推理场景空间布局。获取布局后，Seed3D 2.0 可以逐个生成 3D 内容，并按照空间关系进行组合，构建丰富且完整的场景。

Seed3D 2.0 的仿真场景生成流程

更进一步，结合前述的部件级生成与关节化能力，Seed3D 2.0 最终生成的场景不仅具有严谨的空间结构，其中的物体还可以被转化为支持物理交互的关节化 3D 内容，为下游的物理仿真场景奠定了基础。

总结与展望

Seed3D 2.0 在几何精度、PBR 材质质量以及下游可用性方面取得了显著进展。不过，3D 生成仍然面临一系列长期挑战：几何生成的精细度与泛化性尚有提升空间；纹理生成还存在遮挡与贴图误差问题；3D 生成模型的大规模应用受限于推理效率；3D 生成模型的落地场景还存在未知与探索空间。未来，我们会在这些方向上继续攻坚，推动 3D 生成技术在更多场景中规模化应用。

阅读原文

跳转微信打开

この記事をシェア

字节跳动Seed重要度42026年4月9日 13:01

Seed全双工音声大規模モデル発表：傾聴力と耐妨害性を備え、より自然な対話へ

字节跳动Seed2026年4月1日 12:29

バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始（インターン含む）

字节跳动Seed重要度42026年2月14日 14:57

Seed2.0 正式リリース

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む

字节跳动Seed·2026年4月23日 13:23·約13分

Seed3D 2.0リリース、高精度化と可用性の向上

#3D生成 #DiTアーキテクチャ #PBRマテリアル #具身知能 #火山エンジン

TL;DR

字节跳动Seedチームは、複雑な構造と物理的に一貫したPBRマテリアルを生成するSeed3D 2.0を公開し、3D生成モデルの実用化を加速させた。

AI深層分析2026年4月23日 18:23

重要/ 5段階

深度40%

キーポイント

幾何生成の二段階DiTアーキテクチャ導入

Coarse-to-Fine戦略で全体構造と細部を解耦し、鋭利なエッジや複雑トポロジーの生成精度を大幅に向上させた。

統一PBRマテリアルモデルによる物理的一貫性の確保

従来の級聯式RGB生成とPBR分解の誤差累積を解消し、任意光照条件下でも物理的に正確な質感表現を実現。

VAEアーキテクチャの最適化とAPI公開

トークン削減による高精度・高速推論を実現し、技術レポートとAPIを火山エンジン経由で一般提供開始。

人間評価によるSOTA実証

60人の専門評価員による盲検比較テストで、幾何形状生成において既存主要モデルを上回る高い偏好率を確認。

统一PBR架构与双核心创新

摒弃级联式模型，采用统一PBR生成架构；结合MoE架构提升高分辨率细节与边界精度，并引入VLM先验增强未知光照下的材质分解稳定性。

生成质量显著提升

在真实度、材质质量与文字渲染等维度全面优于基线，人类偏好率突破69%。

部件级生成与关节化建模拓展

采用“先理解，再生成”范式实现功能部件拆分与补全，结合运动学识别与物理仿真兼容输出（URDF格式），支持交互式与仿真下游应用。

重要な引用

几何及纹理材质生成均达 SOTA 表现

Seed3D 2.0 的改进思路是，引入 Coarse-to-Fine 两阶段生成策略，把“整体结构”和“几何细节”解耦

完整的 PBR 材质才能确保 3D 内容在任意光照条件下保持物理一致的视觉效果

目前 Seed3D 2.0 技术报告已公开，API 也已上线火山引擎

采用 MoE 架构，提升高分辨率材质的细节与边界精度。...引入 VLM 先验，增强未知光照下的材质分解稳定性与准确性。

Seed3D 2.0 采用“先理解，再生成”的范式...最终模型可输出带有完整关节信息、以 URDF 等标准格式呈现的 3D 内容，实现与 Isaac Sim 等主流物理仿真引擎的兼容。

影響分析・編集コメントを表示

影響分析

編集コメント

原作：ByteDance Seed 2026-04-23 12:23 北京

image

幾何形状およびテクスチャマテリアルの生成においてSOTA（State of the Art）の性能を達成

image

プロジェクトホームページ：

https://seed.bytedance.com/seed3d_2_0

体験エントリ：

火山方舟（Volcano Ark）体験センター - ログイン - 視覚モデルの選択 - 3D生成 - Doubao - Seed3D-2.0

幾何形状生成：2段階DiT（Diffusion Transformer）の導入、構造の妥当性から詳細の信頼性へ

image

Seed3D 2.0の幾何形状生成の完全なフロー

image

幾何形状次元の定性的比較

image

純粋な幾何形状生成タスクにおいて、ユーザーがSeed3D 2.0を主流モデルよりも優れていると評価した割合

テクスチャ生成：統一PBRモデル、外観の類似から物理的一貫性へ

image

Seed3D 2.0のテクスチャ生成フロー

統一された生成アーキテクチャを基盤とし、さらに2つの重要な革新を導入することで、より高解像度における高精度な材質生成を実現しました。

image

テクスチャ生成次元の定性的比較

image

テクスチャ生成タスクにおいて、ユーザーがSeed3D 2.0を他のベースラインモデルより優れていると評価した割合

Seed3D 2.0の応用タスク探求：部品レベル生成とシーン組み合わせ

image

部品レベル3Dコンテンツ生成フローの概要

image

現実の物理世界は多くの物体が織りなすものであり、そのためSeed3D 2.0は単一オブジェクトの生成能力からシーン（場面）生成へと拡張しました。

image

Seed3D 2.0のシミュレーションシーン生成フロー

まとめと展望

image

阅读原文

跳转微信打开

原文を表示

原创字节跳动Seed 2026-04-23 12:23 北京

image

几何及纹理材质生成均达 SOTA 表现

image

目前 Seed3D 2.0 技术报告已公开，API 也已上线火山引擎，可访问项目主页查看，欢迎体验和交流。

项目主页：

https://seed.bytedance.com/seed3d_2_0

体验入口：

火山方舟体验中心-登录-选择视觉模型-3D生成-Doubao-Seed3D-2.0

几何生成：引入两阶段 DiT，从结构合理到细节可靠

Seed3D 2.0 几何生成的完整流程

阶段一：粗糙几何结构生成。模型利用更大参数规模的 DiT，基于输入图像生成粗粒度的几何结构，建立整体的拓扑关系和空间布局。

阶段二：高精度细节生成。模型以阶段一的输出作为几何锚点，专注于锐利边缘、精细表面等细节恢复，其中引入两种关键先验：

局部感知先验：将第一阶段的粗糙结果转化为隐变量，为后续的细节生成提供可靠的初始化输入，避免“凭空生成”带来的不稳定。

体素化位置编码：在第一阶段生成的几何表面采点，并进行体素化处理，作为位置编码为模型提供空间位置约束。

如下图所示，与现有主流 3D 生成模型的定性对比表明，Seed3D 2.0 在处理复杂结构的精细边缘、生成薄壁结构和还原输入图像方面明显优于基线方法。

几何生成维度的定性对比

在纯几何生成任务中，用户认为 Seed3D 2.0 相比主流模型更优的比例

纹理生成：统一 PBR 模型，从外观相似到物理一致

Seed3D 2.0 的纹理生成流程

我们在统一的生成架构基础上，还引入两项关键创新，实现了更高分辨率下的精准材质生成：

纹理材质生成的定性对比中，Seed3D 2.0 在生成真实度、材质质量、视觉细节和文字渲染等维度上均优于基线方法。

纹理生成维度的定性对比

在纹理 3D 内容生成的人类打分中，Seed3D 2.0 同样领先其他基线方法，面对目前行业内主流模型，Seed3D 2.0 的偏好率达到 69% 以上。

在纹理生成任务中，用户认为 Seed3D 2.0 相比其他基线模型更优的比例

Seed3D 2.0 下游任务探索：部件级生成与场景组合

部件级 3D 内容生成流程概览

Seed3D 2.0 采用“先理解，再生成”的范式，将复杂的部件生成流程分解成两步：对生成的 3D 内容先进行部件级的拆分，然后补全每个部件的完整形状。

独立的部件需要正确的物理连接才能产生有意义的交互。因此在部件分割的基础上，Seed3D 2.0 进一步引入了关节化建模能力。

真实的物理世界是由众多物体交织而成的，因此，Seed3D 2.0 还将单一物体生成能力拓展至场景生成。

Seed3D 2.0 的仿真场景生成流程

总结与展望

阅读原文

跳转微信打开

この記事をシェア

字节跳动Seed重要度42026年4月9日 13:01

Seed全双工音声大規模モデル発表：傾聴力と耐妨害性を備え、より自然な対話へ

字节跳动Seed2026年4月1日 12:29

バイトダンス、2027年卒向け大規模言語モデル人材の新卒採用を開始（インターン含む）

字节跳动Seed重要度42026年2月14日 14:57

Seed2.0 正式リリース

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む

Seed3D 2.0リリース、高精度化と可用性の向上

キーポイント

重要な引用

影響分析

編集コメント

関連記事

Seed3D 2.0リリース、高精度化と可用性の向上

キーポイント

重要な引用

影響分析

編集コメント

関連記事