LLM2D

摘要

arXiv:2504.21037v1 安全类型：交叉摘要：对安全漏洞报告（SBRs）的早期检测对于防止漏洞并确保系统可靠性至关重要。尽管已经为预测SBR开发了机器学习模型，但它们的预测性能仍有改进空间。在本研究中，我们对BERT和随机森林（RF），一个预测SBR的有力基线模型，进行了全面比较。结果表明，对于单个项目预测，RF在平均G-度量方面比BERT高出34%。仅添加各种项目的SBRs两种模型的平均性能都有所提高。然而，纳入安全性及非安全性漏洞报告显著降低了RF的平均性能至46%，而将BERT提升至其最佳平均性能66%，超过了RF。在跨项目SBR预测方面，BERT实现了令人瞩目的62%平均G-度量，远高于RF。