LLM2D
基于代码结构引导的强化学习的Verilog生成大语言模型
Large Language Model for Verilog Generation with Code-Structure-Guided Reinforcement Learning
作者: Ning Wang, Bingkun Yao, Jie Zhou, Xi Wang, Zhe Jiang, Nan Guan
发布日期: 4/14/2025
arXiv ID: oai:arXiv.org:2407.18271v3

摘要

arXiv:2407.18271v3 公告类型: replace-cross 摘要: 近年来,大规模语言模型(LLMs)的进步引发了对自动生成寄存器传输级(RTL)设计的广泛关注,特别是使用Verilog进行生成。目前,该领域的研究主要集中在预训练和指令微调上,但这些方法的有效性受到训练数据有限的限制,因为公开的Verilog代码远少于软件代码。具体来说,这些方法难以有效捕捉Verilog并行代码结构,而这些结构与大多数软件编程语言中典型的命令式、顺序控制流不同。本文介绍了VeriSeek,这是一种通过有限的高质量训练数据增强的强化学习方法,实现了高效的Verilog代码生成性能。我们的强化学习方法利用代码结构信息作为反馈信号来完善预训练模型,使其能够有效地从具有并行结构的Verilog代码中学习重要模式。实验结果表明,VeriSeek在多个基准测试中优于现有最先进的方法。