LLM2D
PyraNet:一种多层次层次化数据集用于Verilog
PyraNet: A Multi-Layered Hierarchical Dataset for Verilog
作者: Bardia Nadimi, Ghali Omar Boutaib, Hao Zheng
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2412.06947v3

摘要

arXiv:2412.06947v3 通知类型: 替换-交叉 摘要:近年来,利用大型语言模型生成Verilog代码的兴趣日益增长。然而,当前生成的Verilog代码的质量仍然不尽如人意。这主要是由于缺乏高质量、组织良好的数据集以及针对Verilog进行创新性微调方法和模型的缺乏。在这篇论文中,我们介绍了一个新型开源数据集和相应的微调技术,该技术利用了我们称之为PyraNet的多层结构。我们的实验表明,采用提出的数据集和微调方法可导致更准确的微调模型,生成语法正确且功能正确的Verilog代码。评估结果显示,与CodeLlama-7B基准模型相比,改进幅度最高可达32.6%,与使用VerilogEval评估平台的最新模型相比,改进幅度最高可达16.7%。