摘要
arXiv:2411.05823v2 Announce Type: replace-cross
摘要:最近,基于用户意图创建计算机辅助设计(CAD)模型的兴趣越来越浓厚,这被称为可控制的CAD生成。现有的工作提供了有限的控制能力,并需要为不同类型的控制单独使用模型,这降低了效率和实用性。为了在所有CAD构建层次上实现可控生成,比如草图-挤出、挤出、草图、面、环和曲线,我们提出了FlexCAD,这是一种通过调整大型语言模型(LLMs)的统一模型。首先,为了增强LLMs的理解能力,我们将CAD模型表示为结构化的文本,并将每个层次抽象为文本标记序列。其次,为了在一个统一模型中应对各种可控生成任务,我们引入了一种层次感知掩蔽策略。具体来说,在训练过程中,我们用掩蔽标记遮住CAD文本中的层次感知字段。该字段由一系列标记组成,可以灵活设置以表示各种层次。随后,我们要求LLMs预测这个被遮掩的字段。在推理过程中,用户意图被转换为CAD文本,其中用掩蔽标记替换用户想要修改的部分,然后将这些文本输入FlexCAD以生成新的CAD模型。在公开数据集上的全面实验表明,FlexCAD在生成质量和可控性方面具有有效性。代码将在 https://github.com/microsoft/FlexCAD 可用。