摘要
arXiv:2412.06947v3 通知类型: 替换-交叉
摘要:近年来,利用大型语言模型生成Verilog代码的兴趣日益增长。然而,当前生成的Verilog代码的质量仍然不尽如人意。这主要是由于缺乏高质量、组织良好的数据集以及针对Verilog进行创新性微调方法和模型的缺乏。在这篇论文中,我们介绍了一个新型开源数据集和相应的微调技术,该技术利用了我们称之为PyraNet的多层结构。我们的实验表明,采用提出的数据集和微调方法可导致更准确的微调模型,生成语法正确且功能正确的Verilog代码。评估结果显示,与CodeLlama-7B基准模型相比,改进幅度最高可达32.6%,与使用VerilogEval评估平台的最新模型相比,改进幅度最高可达16.7%。