LLM2D

摘要

arXiv:2411.05823v2 Announce Type: replace-cross 摘要：最近，基于用户意图创建计算机辅助设计（CAD）模型的兴趣越来越浓厚，这被称为可控制的CAD生成。现有的工作提供了有限的控制能力，并需要为不同类型的控制单独使用模型，这降低了效率和实用性。为了在所有CAD构建层次上实现可控生成，比如草图-挤出、挤出、草图、面、环和曲线，我们提出了FlexCAD，这是一种通过调整大型语言模型（LLMs）的统一模型。首先，为了增强LLMs的理解能力，我们将CAD模型表示为结构化的文本，并将每个层次抽象为文本标记序列。其次，为了在一个统一模型中应对各种可控生成任务，我们引入了一种层次感知掩蔽策略。具体来说，在训练过程中，我们用掩蔽标记遮住CAD文本中的层次感知字段。该字段由一系列标记组成，可以灵活设置以表示各种层次。随后，我们要求LLMs预测这个被遮掩的字段。在推理过程中，用户意图被转换为CAD文本，其中用掩蔽标记替换用户想要修改的部分，然后将这些文本输入FlexCAD以生成新的CAD模型。在公开数据集上的全面实验表明，FlexCAD在生成质量和可控性方面具有有效性。代码将在 https://github.com/microsoft/FlexCAD 可用。