LLM2D

摘要

arXiv:2504.09474v1 Announce Type: cross 摘要：独立树外内核补丁对于将 Linux 内核适应新硬件或启用特定功能至关重要。从不同内核版本维护和更新这些补丁需要经验丰富工程师的巨大努力。大规模语言模型（LLMs）在各个领域取得了显著进步，表明它们有潜力自动化独立树外内核补丁的迁移。然而，我们的研究发现，尽管前景广阔，LLMs 在理解不完整的代码上下文和识别不准确的迁移点方面仍存在问题。在本文中，我们提出了一种名为 MigGPT 的框架，该框架采用了一种新颖的代码指纹结构来保留代码片段信息，并结合了三个精心设计的模块，以提高独立树外内核补丁迁移的准确性和效率。此外，我们使用真实的独立树外内核补丁项目建立了稳健的基准来评估 LLM 的能力。评估结果显示，MigGPT 显著优于直接应用的通用 LLM，迁移任务的平均完成率为 72.59%（比直接应用的通用 LLM 提高了 50.74%）。