LLM2D
AD-LLM: 大型语言模型的异常检测基准测试
AD-LLM: Benchmarking Large Language Models for Anomaly Detection
作者: Tiankai Yang, Yi Nian, Shawn Li, Ruiyao Xu, Yuangang Li, Jiaqi Li, Zhuo Xiao, Xiyang Hu, Ryan Rossi, Kaize Ding, Xia Hu, Yue Zhao
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2412.11142v2

摘要

arXiv:2412.11142v2 宣告类型: 替换交叉 摘要:异常检测(AD)是一项重要的机器学习任务,在许多实际应用中都有广泛的应用,包括欺诈检测、医疗诊断和工业监控。在自然语言处理(NLP)领域,AD有助于检测诸如垃圾邮件、虚假信息和异常用户活动等问题。尽管大规模语言模型(LLM)在文本生成和总结等任务中取得了显著影响,但其在AD中的潜力尚未得到充分研究。本文介绍了AD-LLM,这是第一个评估LLM如何帮助进行NLP异常检测的标准。我们研究了三个关键任务:(i)零样本检测,利用LLM预先训练的知识来进行AD,无需特定任务的训练;(ii)数据增强,生成合成数据和类别描述以提高AD模型的效果;以及(iii)模型选择,使用LLM建议无监督AD模型。通过使用不同数据集的实验发现,LLM在零样本AD中可以有效工作,精心设计的增强方法是有用的,而为特定数据集解释模型选择仍然具有挑战性。基于这些结果,我们提出了六项关于利用LLM进行AD的未来研究方向。