摘要
arXiv:2504.14560v3 宣告类型: 替换-交叉
摘要:大型语言模型(LLMs)在Verilog代码生成方面取得了显著进展,但在数据质量、推理能力和计算效率方面仍面临挑战。本文提出了一种新的模型ReasoningV,该模型采用了一种结合受训内生能力和动态推理适应的混合推理策略,用于Verilog代码生成。我们的框架引入了三项互补创新:(1) ReasoningV-5K,一个包含5,000个功能经过验证的实例的高质量数据集,这些实例的推理路径是通过多维过滤PyraNet样本生成的;(2) 结合参数高效的微调以掌握基础知识,并进行全面参数优化以增强推理能力的两阶段训练方法;(3) 一种自适应推理机制,该机制根据问题复杂性动态调整推理深度,最多可减少75%的token消耗,同时保持性能。实验结果表明,ReasoningV在VerilogEval-human中的@1准确率为57.8%,性能与领先商用模型Gemini-2.0-flash(59.5%)相当,并且超越了之前最佳的开源模型10.4个百分点。ReasoningV提供了一条更可靠且易于访问的途径,以促进基于AI的硬件设计自动化,您可以在https://github.com/BUAA-CLab/ReasoningV 获得我们的模型、数据和代码。