LLM2D
LogLLM:基于日志的大语言模型异常检测
LogLLM: Log-based Anomaly Detection Using Large Language Models
作者: Wei Guan, Jian Cao, Shiyou Qian, Jianqi Gao, Chun Ouyang
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2411.08561v4

摘要

arXiv:2411.08561v4 宣布类型: replace-cross 摘要:软件系统通常会在日志中记录重要的运行时信息,以帮助进行故障排除。基于日志的异常检测已成为一个关键的研究领域,旨在通过日志数据识别系统问题,最终提高软件系统的可靠性。传统的深度学习方法通常难以捕捉嵌入在日志数据中的语义信息,这些数据通常以自然语言组织。在本文中,我们提出了一种基于日志的异常检测框架LogLLM,该框架利用了大型语言模型(LLMs)。LogLLM 使用 BERT 从日志消息中提取语义向量,同时利用基于变压器解码器的 Llama 模型对日志序列进行分类。此外,我们引入了一种投影器以对齐 BERT 和 Llama 的向量表示空间,确保对日志语义的理解一致。与传统方法需要日志解析器提取模板不同,LogLLM 通过正则表达式预处理日志消息,简化了整个过程。我们的框架通过一种新颖的三阶段训练程序进行训练,旨在提高性能和适应性。在四个公开数据集上的实验结果表明,LogLLM 超过了最先进的方法。即使处理不稳定日志,它也能准确捕获日志消息的语义意义并检测异常。