LLM2D

摘要

arXiv:2503.20798v1 类型: cross 摘要: 入侵检测系统（IDS）对于识别恶意流量至关重要，但传统的基于签名的方法在应对零日攻击和高误报率方面存在困难。基于人工智能的包捕获分析提供了一种有前景的替代方案。然而，现有的方法严重依赖于基于流或统计特征，限制了它们检测细微攻击模式的能力。本研究提出了一种改进的卷积多头注意机制集成（CMAE）模型——Xavier-CMAE，该模型提高了检测准确性并减少了计算开销。通过使用十六进制到整数标记化器替换Word2Vec嵌入，并采用Xavier初始化，Xavier-CMAE消除了预训练过程，加快了训练速度，并实现了99.971%的准确率和0.018%的误报率，优于基于Word2Vec的方法。此外，我们引入了LLM-CMAE，该模型将预训练的大语言模型（LLM）标记化器集成到CMAE中。尽管大语言模型增强了特征提取，但其计算成本阻碍了实时检测。LLM-CMAE实现了高效和性能的平衡，达到了99.969%的准确率和0.019%的误报率。本工作通过（1）引入基于负载的检测框架，（2）通过Xavier-CMAE提高效率，以及（3）通过集成大语言模型标记化器增强实时检测，推进了基于人工智能的IDS。