LLM2D
FlexCAD:经过微调的大语言模型驱动的统一可配置的CAD生成
FlexCAD: Unified and Versatile Controllable CAD Generation with Fine-tuned Large Language Models
作者: Zhanwei Zhang, Shizhao Sun, Wenxiao Wang, Deng Cai, Jiang Bian
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2411.05823v2

摘要

arXiv:2411.05823v2 Announce Type: replace-cross 摘要:最近,基于用户意图创建计算机辅助设计(CAD)模型的兴趣越来越浓厚,这被称为可控制的CAD生成。现有的工作提供了有限的控制能力,并需要为不同类型的控制单独使用模型,这降低了效率和实用性。为了在所有CAD构建层次上实现可控生成,比如草图-挤出、挤出、草图、面、环和曲线,我们提出了FlexCAD,这是一种通过调整大型语言模型(LLMs)的统一模型。首先,为了增强LLMs的理解能力,我们将CAD模型表示为结构化的文本,并将每个层次抽象为文本标记序列。其次,为了在一个统一模型中应对各种可控生成任务,我们引入了一种层次感知掩蔽策略。具体来说,在训练过程中,我们用掩蔽标记遮住CAD文本中的层次感知字段。该字段由一系列标记组成,可以灵活设置以表示各种层次。随后,我们要求LLMs预测这个被遮掩的字段。在推理过程中,用户意图被转换为CAD文本,其中用掩蔽标记替换用户想要修改的部分,然后将这些文本输入FlexCAD以生成新的CAD模型。在公开数据集上的全面实验表明,FlexCAD在生成质量和可控性方面具有有效性。代码将在 https://github.com/microsoft/FlexCAD 可用。