LLM2D

摘要

arXiv:2505.06507v1 宣告类型: 新发布摘要: 计算机辅助设计（CAD）是现代工程和制造的基础，但创建CAD模型仍然需要专家知识和专用软件。最近大规模语言模型（LLMs）的发展为生成式CAD提供了可能性，在这种模式下，自然语言可以直接转换成参数化的3D模型。然而，现有的大多数方法生成的是任务特定的命令序列，这些序列预训练模型无法直接处理。这些序列必须转换为CAD表示，如CAD向量，才能生产出3D模型，这需要从头开始训练模型，增加了不必要的复杂性。为了解决这个问题，我们提出直接从文本生成CadQuery代码，利用预训练LLMs的优势，生产3D模型而不需要中间表示，使用基于Python的脚本语言。由于LLMs已经在Python生成和空间推理方面表现出色，通过Text-to-CadQuery数据对其进行微调证明非常有效。鉴于这些能力通常会随着规模的增加而提高，我们假设更大的模型在微调后会表现更好。为了实现这一点，我们通过添加170,000个CadQuery注释来增强Text2CAD数据集。我们对六个不同规模的开源LLMs进行了微调，并观察到一致的改进。我们的最佳模型实现了Top-1精确匹配率69.3%，而之前的匹配率为58.8%，同时减少了48.6%的Chamfer Distance。项目页面: https://github.com/Text-to-CadQuery/Text-to-CadQuery。