LLM2D

摘要

arXiv:2412.11142v2 宣告类型: 替换交叉摘要：异常检测（AD）是一项重要的机器学习任务，在许多实际应用中都有广泛的应用，包括欺诈检测、医疗诊断和工业监控。在自然语言处理（NLP）领域，AD有助于检测诸如垃圾邮件、虚假信息和异常用户活动等问题。尽管大规模语言模型（LLM）在文本生成和总结等任务中取得了显著影响，但其在AD中的潜力尚未得到充分研究。本文介绍了AD-LLM，这是第一个评估LLM如何帮助进行NLP异常检测的标准。我们研究了三个关键任务：（i）零样本检测，利用LLM预先训练的知识来进行AD，无需特定任务的训练；（ii）数据增强，生成合成数据和类别描述以提高AD模型的效果；以及（iii）模型选择，使用LLM建议无监督AD模型。通过使用不同数据集的实验发现，LLM在零样本AD中可以有效工作，精心设计的增强方法是有用的，而为特定数据集解释模型选择仍然具有挑战性。基于这些结果，我们提出了六项关于利用LLM进行AD的未来研究方向。