LLM2D
深度正无标签异常检测:污染的无标签数据异常检测
Deep Positive-Unlabeled Anomaly Detection for Contaminated Unlabeled Data
作者: Hiroshi Takahashi, Tomoharu Iwata, Atsutoshi Kumagai, Yuuki Yamanaka
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2405.18929v2

摘要

arXiv:2405.18929v2 宣言类型: replace-cross 摘要:半监督异常检测旨在通过使用少量标记异常数据以及未标记数据来提高异常检测性能,这种方法引起了关注。现有的半监督方法假设大部分未标记数据是正常的,并通过最小化未标记数据的异常评分并最大化标记异常数据的异常评分来训练异常检测器。然而,在实践中,未标记数据往往受到异常的污染。这削弱了最大化异常评分的效果,并阻止我们提高检测性能。为了解决这个问题,我们提出了一种深度正负未标记异常检测框架,该框架结合了正负未标记学习与深度异常检测模型(如自编码器和深度支持向量数据描述)。我们的方法能够使用未标记数据和标记异常数据来近似正常数据的异常评分。因此,即使没有标记正常数据,我们的方法也能通过最小化正常数据的异常评分并最大化标记异常数据的异常评分来训练异常检测器。在各种数据集上的实验表明,我们的方法在检测性能上优于现有方法。