LLM2D

摘要

arXiv:2504.21476v2 宣告类型: replace-cross 摘要：服装裁剪模式是连接设计概念和实际制造的基本设计元素。生成裁剪模式的建模对于创造多样化服装至关重要。然而，现有方法要么依赖单一输入模态，要么生成效率欠佳。在本文中，我们提出了GarmentDiffusion，这是一种新型生成模型，能够从多模态输入（文本、图像和不完整的裁剪模式）生成厘米级精确的矢量3D裁剪模式。我们的方法高效地将3D裁剪模式参数编码为紧凑的边代币表示，将序列长度缩短至DressCode中自回归SewingGPT的十分之一。通过使用扩散变换器，我们沿时间轴同时去除所有边代币的噪声，同时保持去噪步骤数不变，不受数据集特定边缘和面板统计学的影响。通过我们模型所有设计组合，裁剪模式生成速度比SewingGPT快100倍。我们在DressCodeData和最大的裁剪模式数据集GarmentCodeData上均实现了新的最佳性能结果。项目网站可在https://shenfu-research.github.io/Garment-Diffusion/访问。