摘要
arXiv:2502.07049v2 宣告类型: replace-cross
摘要:大型语言模型(LLMs)正在成为软件漏洞检测的变革性工具,解决了安全领域的关键挑战。传统方法,如静态分析和动态分析,由于效率低下、高误报率和现代软件系统的日益复杂性而常常失效。通过利用其对代码结构进行分析、识别模式和生成修复建议的能力,LLMs,如GPT、BERT和CodeBERT等模型,提供了一种新的、可扩展的漏洞缓解方法。本文对LLMs在漏洞检测中的应用进行了详尽的综述。它考察了关键方面,包括模型架构、应用方法、目标语言、微调策略、数据集和评估指标。我们还分析了当前研究问题的范围,强调了现有方法的优势和不足。此外,我们还探讨了跨语言漏洞检测、多模态数据集成和仓库级别分析等方面的挑战。基于这些发现,我们提出了解决问题的方案,如数据集可扩展性、模型可解释性和在资源有限场景中的应用。我们的贡献包括三个方面:(1)系统回顾LLMs在漏洞检测中的应用;(2)分析研究间的共同模式和差异,并提供一个统一的框架来理解该领域;(3)总结关键挑战和未来研究方向。这项工作为基于LLM的漏洞检测提供了有价值的见解。我们还维护并定期更新最新的精选论文,网址为https://github.com/OwenSanzas/LLM-For-Vulnerability-Detection