LLM2D
基于Payloadaware的入侵检测与CMAE和大规模语言模型
Payload-Aware Intrusion Detection with CMAE and Large Language Models
作者: Yongcheol Kim, Chanjae Lee, Young Yoon
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.20798v1

摘要

arXiv:2503.20798v1 类型: cross 摘要: 入侵检测系统(IDS)对于识别恶意流量至关重要,但传统的基于签名的方法在应对零日攻击和高误报率方面存在困难。基于人工智能的包捕获分析提供了一种有前景的替代方案。然而,现有的方法严重依赖于基于流或统计特征,限制了它们检测细微攻击模式的能力。本研究提出了一种改进的卷积多头注意机制集成(CMAE)模型——Xavier-CMAE,该模型提高了检测准确性并减少了计算开销。通过使用十六进制到整数标记化器替换Word2Vec嵌入,并采用Xavier初始化,Xavier-CMAE消除了预训练过程,加快了训练速度,并实现了99.971%的准确率和0.018%的误报率,优于基于Word2Vec的方法。此外,我们引入了LLM-CMAE,该模型将预训练的大语言模型(LLM)标记化器集成到CMAE中。尽管大语言模型增强了特征提取,但其计算成本阻碍了实时检测。LLM-CMAE实现了高效和性能的平衡,达到了99.969%的准确率和0.019%的误报率。本工作通过(1)引入基于负载的检测框架,(2)通过Xavier-CMAE提高效率,以及(3)通过集成大语言模型标记化器增强实时检测,推进了基于人工智能的IDS。