LLM2D

摘要

arXiv:2412.06947v3 通知类型: 替换-交叉摘要：近年来，利用大型语言模型生成Verilog代码的兴趣日益增长。然而，当前生成的Verilog代码的质量仍然不尽如人意。这主要是由于缺乏高质量、组织良好的数据集以及针对Verilog进行创新性微调方法和模型的缺乏。在这篇论文中，我们介绍了一个新型开源数据集和相应的微调技术，该技术利用了我们称之为PyraNet的多层结构。我们的实验表明，采用提出的数据集和微调方法可导致更准确的微调模型，生成语法正确且功能正确的Verilog代码。评估结果显示，与CodeLlama-7B基准模型相比，改进幅度最高可达32.6%，与使用VerilogEval评估平台的最新模型相比，改进幅度最高可达16.7%。