LLM2D

摘要

arXiv:2504.19144v1 宣告类型: 新摘要：对专用领域架构（DSA）日益增长的需求推动了敏捷硬件开发方法（AHDM）的发展。类似 Chisel 的硬件构造语言（HCL）提供了高层抽象功能，使其成为基于 HCL 的 AHDM 的理想语言。尽管大型语言模型（LLMs）在代码生成任务方面表现出色，但在处理 Chisel 生成时仍面临挑战，特别是在语法正确性和设计变异性方面。最近的推理模型通过测试时的比例扩大技术显著提高了代码生成能力。然而，我们发现未经领域适应的推理模型无法为 Chisel 代码生成任务带来实质性的益处。本文提出了一种名为 ChiseLLM 的解决方案，该方案包括数据处理和转换、提示引导推理追踪合成以及领域适应模型训练。我们从公开的 RTL 代码资源中构建了高质量的数据集，并通过提示增强方法指导模型采用结构化思考模式。实验表明，与基线模型相比，我们的 ChiseLLM-7B 和 ChiseLLM-32B 模型分别提高了 18.85% 和 26.32% 的语法正确性，同时相较于基线推理模型，设计变异性能力提高了 47.58%。我们的数据集和模型已公开，为基于 HCL 的 AHDM 提供了高性能、成本效益高的模型，为未来的研究提供了有效的基线。GitHub 仓库：https://github.com/observerw/ChiseLLM