LLM2D

摘要

arXiv:2409.18219v2 命中类型: 交叉学科摘要：随着网络的不断扩展和相互连接变得更加紧密，对新颖恶意软件检测方法的需求也变得更加明显。传统的安全措施越来越难以应对现代网络攻击的复杂性。深度包检测（DPI）在增强网络安全方面发挥了关键作用，提供了超越常规监控技术的深入分析网络流量的能力。DPI 不仅检查网络包的元数据，还将深入研究包载荷中实际承载的内容，提供网络中流动数据的全面视图。尽管将高级深度学习技术与DPI 相结合引入了现代恶意软件检测和网络流量分类方法，但最先进的监督学习方法受限于其对大量标注数据的依赖及其无法将新颖的未见过的恶意软件威胁泛化的能力。为了解决这些限制，本文利用了自监督学习（SSL）和少样本学习（FSL）的最新进展。我们提出了一种自监督方法，通过SSL训练一个转换器，从大量未标注的数据中学习包内容（包括载荷）的表示，通过掩蔽部分包来实现，从而获得一个适用于各种下游任务的泛化表示。一旦从包中提取了表示，它们就被用于训练恶意软件检测算法。然后，从转换器获得的表示用于使用少样本学习方法将恶意软件检测器适应于新的攻击类型。我们的实验结果表明，我们的方法在UNSW-NB15数据集上实现了高达94.76%的分类准确率，在CIC-IoT23数据集上实现了83.25%的分类准确率。