Hunyuan3D-2：基于大规模扩散模型的高分辨率、带纹理 3D 资产生成系统，采用形状生成与纹理合成两阶段解耦的架构

摘要

腾讯开源的 Hunyuan3D-2 是一个基于大规模扩散模型的高分辨率、带纹理 3D 资产生成系统，采用形状生成与纹理合成两阶段解耦的架构。

核心架构：系统由大规模形状生成模型（Hunyuan3D-DiT，基于流匹配的扩散Transformer）和纹理合成模型（Hunyuan3D-Paint）组成，支持为AI生成或手工制作的网格（Mesh）生成高分辨率纹理。
硬件门槛：显存需求较低，仅需 6GB VRAM 即可运行形状生成，16GB VRAM 可完成“形状+纹理”的端到端生成。
性能表现：在 CMMD (3.193)、FID_CLIP (49.165)、FID (282.429) 和 CLIP-score (0.809) 等核心指标上，均优于文档中对比的其他头部开源与闭源 3D 生成模型。
丰富的模型矩阵：开源了多个版本，包括基础版（1.1B 形状模型/1.3B 纹理模型）、轻量版（Hunyuan3D-2mini，0.6B）、多视角版（Hunyuan3D-2mv），以及用于加速推理的 Turbo（步数蒸馏）和 Fast（引导蒸馏）版本。
最新迭代：已发布 Hunyuan3D-2.1 版本，全面开源了全新的 PBR 模型、VAE 编码器以及所有训练代码。
多平台与接口支持：兼容 macOS、Windows 和 Linux，提供类 Diffusers 的 Python API，并支持通过 Gradio Web UI、本地 API 服务器以及官方 Blender 插件进行调用。
社区生态：社区已为其开发了 Windows 便携安装包以及多个 ComfyUI 扩展节点（如 ComfyUI-3D-Pack、ComfyUI-Hunyuan3DWrapper）。

High-Resolution 3D Assets Generation with Large Scale Hunyuan3D Diffusion Models.