LLM2D

摘要

arXiv:2502.07049v1 类型: cross 摘要: 大型语言模型（LLMs）正在成为软件漏洞检测变革性的工具，解决了安全领域中的关键挑战。传统方法，如静态和动态分析，由于效率低下、高误报率和现代软件系统的复杂性不断提高而常常失灵。通过利用其分析代码结构、识别模式和生成修复建议的能力，LLMs，如GPT、BERT和CodeBERT等模型，提供了一种新颖且可扩展的漏洞缓解方法。本文详细介绍了LLMs在漏洞检测中的应用。它探讨了关键方面，包括模型架构、应用方法、目标语言、微调策略、数据集和评估指标。我们还分析了当前研究问题的范围，强调了现有方法的优点和不足。此外，我们探讨了跨语言漏洞检测、多模态数据分析集成和仓库级别分析等挑战。基于这些发现，我们为数据集的可扩展性、模型可解释性和在低资源场景中的应用提出了解决方案。我们的贡献有三个方面：(1)系统性地回顾了LLMs在漏洞检测中的应用；(2)对研究中的共性和差异进行了分析，并提供了一个统一的框架来理解该领域；(3)总结了关键挑战和未来的研究方向。本文为基于LLM的漏洞检测提供了有价值的见解。我们还在https://github.com/OwenSanzas/LLM-For-Vulnerability-Detection维护并定期更新最新的精选论文。