摘要
本文探讨了利用预训练语言模型和孪生网络来辨别文本形式的网络安全漏洞数据之间的兄弟关系。本文提出的方法的最终目的是基于一组描述给定系统中潜在/已观察到的漏洞的文本描述构建分层攻击模型。由于数据的性质以及问题所处的敏感的不确定性环境,需要采用面向实践的软计算方法。因此,本工作的重点是调查围绕预测链接可靠性的实际问题,以构建此类模型,为此,概述了与所提出方法相关的概念和实际挑战以及解决方案,例如数据集复杂性和预测的稳定性。因此,本文的贡献集中在使用预训练语言模型生成神经网络来预测网络安全漏洞之间的兄弟关系,然后概述如何将此功能应用于生成分层攻击模型。此外,还概述了两种用于解决数据复杂性的数据采样机制,以及一种用于减少误报预测数量的共识机制。使用来自三组网络安全数据的经验结果对每种方法进行了比较和对比,以确定其有效性。