摘要
arXiv:2504.21476v2 宣告类型: replace-cross
摘要:服装裁剪模式是连接设计概念和实际制造的基本设计元素。生成裁剪模式的建模对于创造多样化服装至关重要。然而,现有方法要么依赖单一输入模态,要么生成效率欠佳。在本文中,我们提出了GarmentDiffusion,这是一种新型生成模型,能够从多模态输入(文本、图像和不完整的裁剪模式)生成厘米级精确的矢量3D裁剪模式。我们的方法高效地将3D裁剪模式参数编码为紧凑的边代币表示,将序列长度缩短至DressCode中自回归SewingGPT的十分之一。通过使用扩散变换器,我们沿时间轴同时去除所有边代币的噪声,同时保持去噪步骤数不变,不受数据集特定边缘和面板统计学的影响。通过我们模型所有设计组合,裁剪模式生成速度比SewingGPT快100倍。我们在DressCodeData和最大的裁剪模式数据集GarmentCodeData上均实现了新的最佳性能结果。项目网站可在https://shenfu-research.github.io/Garment-Diffusion/访问。