摘要
arXiv:2502.07049v1 类型: cross
摘要: 大型语言模型(LLMs)正在成为软件漏洞检测变革性的工具,解决了安全领域中的关键挑战。传统方法,如静态和动态分析,由于效率低下、高误报率和现代软件系统的复杂性不断提高而常常失灵。通过利用其分析代码结构、识别模式和生成修复建议的能力,LLMs,如GPT、BERT和CodeBERT等模型,提供了一种新颖且可扩展的漏洞缓解方法。本文详细介绍了LLMs在漏洞检测中的应用。它探讨了关键方面,包括模型架构、应用方法、目标语言、微调策略、数据集和评估指标。我们还分析了当前研究问题的范围,强调了现有方法的优点和不足。此外,我们探讨了跨语言漏洞检测、多模态数据分析集成和仓库级别分析等挑战。基于这些发现,我们为数据集的可扩展性、模型可解释性和在低资源场景中的应用提出了解决方案。我们的贡献有三个方面:(1)系统性地回顾了LLMs在漏洞检测中的应用;(2)对研究中的共性和差异进行了分析,并提供了一个统一的框架来理解该领域;(3)总结了关键挑战和未来的研究方向。本文为基于LLM的漏洞检测提供了有价值的见解。我们还在https://github.com/OwenSanzas/LLM-For-Vulnerability-Detection维护并定期更新最新的精选论文。