摘要
arXiv:2504.14560v1 宣布类型: cross
摘要:大规模语言模型(LLMs)在提高Verilog代码生成方面取得了显著进展,但在数据质量、推理能力和计算效率方面仍面临挑战。本文提出了一种名为ReasoningV的新模型,该模型采用了一种结合训练内在能力与动态推理适应的混合推理策略,用于Verilog代码生成。我们的框架引入了三项互补的创新:(1)ReasoningV-5K,一个包含5,000个功能验证实例的高质量数据集,这些实例通过多维过滤PyraNet样本生成推理路径;(2)结合参数高效微调基础知识与全参数优化增强推理的两阶段训练方法;以及(3)一种自适应推理机制,可根据问题复杂性动态调整推理深度,最多可减少75%的token消耗,同时保持性能。实验结果表明,ReasoningV在VerilogEval-human上的pass@1准确率为57.8%,实现了与领先商用模型Gemini-2.0-flash(59.5%)相当的表现,并比之前的最佳开源模型高出10.4个百分点。ReasoningV为提高AI驱动的硬件设计自动化提供了更可靠且可访问的路径,我们的模型、数据和代码可在https://github.com/BUAA-CLab/ReasoningV获取。