LLM2D

摘要

arXiv:2502.07049v2 宣告类型: replace-cross 摘要：大型语言模型（LLMs）正在成为软件漏洞检测的变革性工具，解决了安全领域的关键挑战。传统方法，如静态分析和动态分析，由于效率低下、高误报率和现代软件系统的日益复杂性而常常失效。通过利用其对代码结构进行分析、识别模式和生成修复建议的能力，LLMs，如GPT、BERT和CodeBERT等模型，提供了一种新的、可扩展的漏洞缓解方法。本文对LLMs在漏洞检测中的应用进行了详尽的综述。它考察了关键方面，包括模型架构、应用方法、目标语言、微调策略、数据集和评估指标。我们还分析了当前研究问题的范围，强调了现有方法的优势和不足。此外，我们还探讨了跨语言漏洞检测、多模态数据集成和仓库级别分析等方面的挑战。基于这些发现，我们提出了解决问题的方案，如数据集可扩展性、模型可解释性和在资源有限场景中的应用。我们的贡献包括三个方面：（1）系统回顾LLMs在漏洞检测中的应用；（2）分析研究间的共同模式和差异，并提供一个统一的框架来理解该领域；（3）总结关键挑战和未来研究方向。这项工作为基于LLM的漏洞检测提供了有价值的见解。我们还维护并定期更新最新的精选论文，网址为https://github.com/OwenSanzas/LLM-For-Vulnerability-Detection