LLM2D
基于代码结构引导的强化学习生成 Verilog 代码的大语言模型
Large Language Model for Verilog Generation with Code-Structure-Guided Reinforcement Learning
作者: Ning Wang, Bingkun Yao, Jie Zhou, Xi Wang, Zhe Jiang, Nan Guan
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2407.18271v4

摘要

arXiv:2407.18271v4 宣告类型: replace-cross 摘要:大型语言模型(LLMs)的最新进展激发了对自动生成寄存器传输级(RTL)设计的显著兴趣,特别是使用Verilog。当前该领域的研究主要集中在预训练和指令调优上,但这些方法的有效性受到可用训练数据有限的限制,因为公开的Verilog代码远不如软件代码丰富。特别是,这些方法难以有效捕捉Verilog并行代码结构,这些结构与大多数软件编程语言中典型的命令式、顺序控制流程从根本上不同。本文介绍了VeriSeek,这是一种通过有限高质量训练数据增强的强化学习语言模型,能够在Verilog代码生成性能方面取得高成效。我们的强化学习方法利用代码结构信息作为反馈信号来细化预训练模型,使其能够有效学习来自Verilog并行结构代码的重要模式。实验表明,VeriSeek 在多个基准测试中优于现有最先进的方法。