LLM2D
PATH:用于评估多变量时间序列在线无监督异常检测方法的离散序列数据集
PATH: A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series
作者: Lucas Correia, Jan-Christoph Goos, Thomas B\"ack, Anna V. Kononova
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2411.13951v4

摘要

arXiv:2411.13951v4 宣告类型: 替换合并交叉 摘要: 由于缺乏高质量的数据集,多变量时间序列异常检测方法的基准测试是一项具有挑战性的任务。当前公开可用的数据集太小,不够多样化且包含的异常太简单,这阻碍了该领域的可衡量进展。我们提出了一种解决方案:通过最先进的仿真工具生成的多样、全面且非平凡的数据集,反映了汽车动力总成的真实行为,包括其多变量、动态和可变状态特性。此外,我们的数据集代表了一个离散序列问题,这是文献中先前提出的解决方案中未解决的问题。为了适应无监督和半监督异常检测设置,以及时间序列生成和预测,我们提供了数据集的不同版本,其中训练和测试子集根据任务提供了受污染和干净版本。我们还提供了一种基于确定性和变分自编码器的方法以及一种非参数方法的选择基线结果。如预期的那样,基线实验表明,在半监督版本的数据集上训练的方法优于无监督版本,突显了对在受污染训练数据下更稳健的方法的需求。此外,结果表明,所使用的阈值对检测性能有很大的影响,因此需要更多工作来开发无需标记数据即可找到合适阈值的方法。