LLM2D

摘要

arXiv:2407.12022v3 公告类型: 替换交叉摘要：最近，大规模语言模型（LLMs）已经展示了卓越的性能，激励研究人员探索其在自动化寄存器传输级（RTL）代码生成以及提高硬件设计效率方面的应用。然而，现有对LLMs进行RTL生成调整的方法通常在固定数据集上进行，这没有充分激发LLMs的能力，并且需要大量的参考资料数据，获取这些数据代价高昂。为解决这些问题，我们创新性地引入了一种迭代训练范式，称为ITERTL。在每次迭代中，从上一个循环中训练的模型中抽取样本。然后，这些新样本用于当前循环中的训练。此外，我们引入了一种插拔式数据过滤策略，从而使模型能够生成高质量、自包含的代码。我们的模型超越了GPT4和最先进的开源模型，在VerilogEval-human基准测试中实现了令人瞩目的53.8%的pass@1率。在数据量和质量相似的条件下，我们的方法显著优于基线。广泛的实验验证了所提出方法的有效性。