LLM2D

摘要

arXiv:2503.22424v1 宣告类型: cross 摘要: 大型语言模型（LLMs）显著促进了自主软件工程的发展，导致越来越多的软件工程代理程序帮助开发者进行自动程序修复。问题定位是准确生成补丁的基础。然而，由于LLMs上下文窗口长度的限制，现有的问题定位方法在兼顾简洁有效的上下文和充分全面的搜索空间方面面临挑战。本文介绍了一种名为CoSIL的方法，这是一个基于LLM、简单而强大的函数级别问题定位方法，无需进行训练或索引。CoSIL通过模块调用图减少搜索空间，迭代搜索函数调用图以获取相关上下文，并使用上下文剪枝来控制搜索方向并有效地管理上下文。重要的是，调用图是在搜索过程中由LLM动态构建的，消除了预解析的需要。实验结果显示，使用Qwen2.5 Coder 32B，CoSIL在SWE bench Lite和SWE bench Verified上的Top-1定位成功率分别为43%和44.6%，比现有方法提高8.6%至98.2%。当CoSIL用于指导补丁生成阶段时，修复率进一步提高9.3%至31.5%。