LLM2D
基于扩展直方图的离群点得分(Extended Histogram-based Outlier Score)
Extended Histogram-based Outlier Score (EHBOS)
作者: Tanvir Islam
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05719v1

摘要

arXiv:2502.05719v1 Announce Type: cross 摘要:直方图基离群点评分(HBOS)是一种广为人知的离群点或异常检测方法,因其计算效率和简单性而受到青睐。然而,它假设特征独立性限制了其在特征之间交互至关重要的数据集中检测异常的能力。本文提出了一种扩展的直方图基离群点评分(EHBOS),通过引入二维直方图来捕捉特征对之间的依赖性,从而增强了HBOS。这种扩展使EHBOS能够识别HBOS无法检测到的上下文驱动和依赖驱动的异常。我们通过17个基准数据集评估了EHBOS,展示了其在各种异常检测场景中的有效性和稳健性。在多个数据集上,EHBOS的表现优于HBOS,特别是在特征交互对于定义异常结构至关重要的数据集中,EHBOS在ROC AUC方面取得了显著的改进。这些结果表明,EHBOS可以成为HBOS的一个有价值的扩展,具备建模复杂特征依赖性的能力。EHBOS提供了一种强大的新工具,特别适用于那些上下文或关系型异常起重要作用的数据集中的异常检测。