LLM2D
从文本到CAD查询:一种具有可扩展大规模模型能力的CAD生成新范式
Text-to-CadQuery: A New Paradigm for CAD Generation with Scalable Large Model Capabilities
作者: Haoyang Xie, Feng Ju
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06507v1

摘要

arXiv:2505.06507v1 宣告类型: 新发布 摘要: 计算机辅助设计(CAD)是现代工程和制造的基础,但创建CAD模型仍然需要专家知识和专用软件。最近大规模语言模型(LLMs)的发展为生成式CAD提供了可能性,在这种模式下,自然语言可以直接转换成参数化的3D模型。然而,现有的大多数方法生成的是任务特定的命令序列,这些序列预训练模型无法直接处理。这些序列必须转换为CAD表示,如CAD向量,才能生产出3D模型,这需要从头开始训练模型,增加了不必要的复杂性。为了解决这个问题,我们提出直接从文本生成CadQuery代码,利用预训练LLMs的优势,生产3D模型而不需要中间表示,使用基于Python的脚本语言。由于LLMs已经在Python生成和空间推理方面表现出色,通过Text-to-CadQuery数据对其进行微调证明非常有效。鉴于这些能力通常会随着规模的增加而提高,我们假设更大的模型在微调后会表现更好。为了实现这一点,我们通过添加170,000个CadQuery注释来增强Text2CAD数据集。我们对六个不同规模的开源LLMs进行了微调,并观察到一致的改进。我们的最佳模型实现了Top-1精确匹配率69.3%,而之前的匹配率为58.8%,同时减少了48.6%的Chamfer Distance。项目页面: https://github.com/Text-to-CadQuery/Text-to-CadQuery。