LLM2D
项目内和跨项目中的安全漏洞报告预测:BERT与随机森林的比较研究
Security Bug Report Prediction Within and Across Projects: A Comparative Study of BERT and Random Forest
作者: Farnaz Soltaniani, Mohammad Ghafari, Mohammed Sayagh
发布日期: 5/1/2025
arXiv ID: oai:arXiv.org:2504.21037v1

摘要

arXiv:2504.21037v1 安全类型:交叉 摘要:对安全漏洞报告(SBRs)的早期检测对于防止漏洞并确保系统可靠性至关重要。尽管已经为预测SBR开发了机器学习模型,但它们的预测性能仍有改进空间。在本研究中,我们对BERT和随机森林(RF),一个预测SBR的有力基线模型,进行了全面比较。结果表明,对于单个项目预测,RF在平均G-度量方面比BERT高出34%。仅添加各种项目的SBRs两种模型的平均性能都有所提高。然而,纳入安全性及非安全性漏洞报告显著降低了RF的平均性能至46%,而将BERT提升至其最佳平均性能66%,超过了RF。在跨项目SBR预测方面,BERT实现了令人瞩目的62%平均G-度量,远高于RF。