LLM2D

摘要

arXiv:2504.15659v1 宣告类型: cross 摘要: 最近大型语言模型(Large Language Models, LLMs)的进步引发了将其应用于电子设计自动化(EDA)任务的兴趣，特别是寄存器传输级(RTL)代码生成。虽然已引入了多个RTL数据集，但大多数侧重于句法有效性而非功能验证，导致训练示例能够编译但可能不会实现预期行为。我们提出了VeriCoder，一种针对验证功能正确的数据集进行微调的RTL代码生成模型。该微调数据集使用新颖的方法构建，结合了单元测试生成和反馈导向的改进。给定自然语言规范和初始RTL设计，我们提示教师模型(GPT-4o-mini)生成单元测试，并根据生成的测试及其仿真结果迭代修订RTL设计。如有必要，教师模型也会更新测试，以确保其符合自然语言规范。这一过程中，我们数据集中的每一个示例都经过了功能验证，包含自然语言描述、RTL实现和通过的测试。在超过125,000个示例的这个数据集上微调后，VeriCoder在VerilogEval和RTLLM上的功能正确性指标达到了最新标准，相对改进幅度分别为71.7%和27.4%。进一步的消融研究显示，基于我们功能验证的数据集训练的模型优于基于非功能验证数据集训练的模型，突显了高质量数据集在RTL代码生成中的重要性。