Hugging Face · Daily Papers
PhysForge:为交互式虚拟世界生成基于物理的 3D 资产
PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World
摘要
合成基于物理的 3D 资产,是交互式虚拟世界和 embodied AI 面临的关键瓶颈。现有方法主要关注静态几何,忽视了交互所必需的功能属性。我们认为,交互式资产生成必须根植于功能逻辑和层次化物理。为弥合这一差距,我们提出 PhysForge:一个解耦的两阶段框架,并由 PhysDB 支撑。PhysDB 是一个包含 150,000 个资产的大规模数据集,带有四层物理标注。
首先,VLM 作为“物理架构师”规划“Hierarchical Physical Blueprint”,定义材质、功能和运动学约束。其次,一个基于物理的 diffusion model 通过新颖的 KineVoxel Injection(KVI)机制实现该蓝图,在合成高保真几何的同时生成精确的运动学参数。实验表明,PhysForge 能够生成在功能上合理、可直接用于 simulation 的资产,为交互式 3D 内容和 embodied agents 提供稳健的数据引擎。