LLM2D

摘要

arXiv:2504.15259v1 文本类型: cross 摘要：数字建模和重建人类面部在各种应用中发挥着作用。然而，其可用性往往受到数据采集设备、人力和技术人员的限制。这种情况限制了最终模型的多样性、表现力和控制能力。这项工作旨在证明一种语义可控生成网络可以为数字面部建模过程提供增强的控制。为了超越有限的受控环境扫描的人类面部，我们引入了一种新型的数据生成流水线，使用预训练的扩散模型创建高质量的3D面部数据库。我们提出的一种归一化模块将扩散模型合成的数据转化为高质量的扫描数据。使用我们获得的44,000个面部模型，我们进一步开发了一个基于GAN的高效生成器。此生成器接受语义属性作为输入，生成几何形状和反射系数，并允许在潜在空间中持续编辑属性。随后，我们的资产精炼组件创建了基于物理的面部资产。我们介绍了一个旨在创建和编辑高质量面部资产的全面系统。我们提出模型已经经过了广泛的实验、比较和评估。我们还将所有内容集成到一个基于Web的交互工具中。我们计划在论文发布时将此工具公开提供。