LLM2D
从LLM到基于LLM的代理在软件工程中的应用:当前研究、挑战与未来调查
From LLMs to LLM-based Agents for Software Engineering: A Survey of Current, Challenges and Future
作者: Haolin Jin, Linghan Huang, Haipeng Cai, Jun Yan, Bo Li, Huaming Chen
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2408.02479v2

摘要

arXiv:2408.02479v2 宣布类型: 交叉替换 摘要:随着大型语言模型(LLMs)的发展,研究人员越来越多地探索它们在各个垂直领域中的应用,如软件工程。LLMs 在代码生成和漏洞检测等领域取得了显著的成功。然而,它们也表现出许多限制和缺点。基于LLMs的代理,作为一种有潜力实现通用人工智能(AGI)的新技术,将LLMs作为决策和行动的核心,解决了一些LLMs固有的局限性,如缺乏自主性和自我改进能力。尽管有众多研究和调查探讨了在软件工程中使用LLMs的可能性,但在LLMs和基于LLMs的代理之间缺乏明确的区别。在该领域还没有一个统一的标准和基准来鉴定一个LLM解决方案是否可以作为基于LLMs的代理。在本文综述中,我们广泛调查了当前在软件工程中用于LLMs和基于LLMs代理的做法和解决方案。特别是我们总结了六个关键话题:需求工程、代码生成、自主决策、软件设计、测试生成和软件维护。我们审查并区分了这些话题中LLMs和基于LLMs代理的工作,检查它们在任务、基准和评估指标方面的差异与相似之处。最后,我们讨论了所使用的基础模型和基准,提供了对它们在软件工程中的应用和效果的全面分析。我们希望这项工作能为未来的研究开拓基于LLMs代理在软件工程中的边界提供一些启示。