LLM2D
ITERTL:一种用于RTL代码生成的LLM微调迭代框架
ITERTL: An Iterative Framework for Fine-tuning LLMs for RTL Code Generation
作者: Peiyang Wu, Nan Guo, Xiao Xiao, Wenming Li, Xiaochun Ye, Dongrui Fan
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2407.12022v3

摘要

arXiv:2407.12022v3 公告类型: 替换交叉 摘要:最近,大规模语言模型(LLMs)已经展示了卓越的性能,激励研究人员探索其在自动化寄存器传输级(RTL)代码生成以及提高硬件设计效率方面的应用。然而,现有对LLMs进行RTL生成调整的方法通常在固定数据集上进行,这没有充分激发LLMs的能力,并且需要大量的参考资料数据,获取这些数据代价高昂。为解决这些问题,我们创新性地引入了一种迭代训练范式,称为ITERTL。在每次迭代中,从上一个循环中训练的模型中抽取样本。然后,这些新样本用于当前循环中的训练。此外,我们引入了一种插拔式数据过滤策略,从而使模型能够生成高质量、自包含的代码。我们的模型超越了GPT4和最先进的开源模型,在VerilogEval-human基准测试中实现了令人瞩目的53.8%的pass@1率。在数据量和质量相似的条件下,我们的方法显著优于基线。广泛的实验验证了所提出方法的有效性。