LLM2D

摘要

尽管深度学习 (DL) 方法在漏洞检测中越来越流行，但其性能受到训练数据不足的严重限制。这主要是因为很少有现有的软件组织能够维护一套完整的、高质量的用于基于深度学习的漏洞检测样本。由于担心隐私泄露，他们中的大多数都不愿共享数据，导致数据孤岛问题。由于联邦学习 (FL) 能够在不共享数据的情况下进行协作模型训练，因此它已被研究作为解决基于深度学习的漏洞检测中数据孤岛问题的一种有前景的方法。然而，由于现有的基于联邦学习的漏洞检测方法侧重于特定应用，因此目前尚不清楚 i) 联邦学习如何更好地适应常见的漏洞检测任务，以及 ii) 如何为特定的漏洞检测任务设计高性能的联邦学习解决方案。为了回答这两个问题，本文首先提出了 VulFL，一个用于基于联邦学习的漏洞检测的有效评估框架。然后，基于 VulFL，本文进行了一项综合研究，以揭示联邦学习在处理不同类型的 CWE（常见弱点枚举）方面的潜在能力，尤其是在面对各种数据异构场景时。我们的实验结果表明，与独立训练相比，联邦学习可以显著提高所有研究的 CWE 上常用 AI 模型的检测性能，尽管基于联邦学习的漏洞检测的性能受到异构数据的限制。为了突出用于漏洞检测的不同联邦学习解决方案之间的性能差异，我们广泛研究了 VulFL 各个框架组件的不同配置策略的影响。我们的研究揭示了联邦学习在漏洞检测中的潜力，这可以用于指导基于联邦学习的漏洞检测解决方案的设计。