摘要
arXiv:2502.12793v1 宣告类型: cross
摘要: 在机器学习领域,检测数据集中的异常值是一个长期存在的问题。在这种情况下,异常值被定义为显著偏离其余数据的样本。同时,最优传输(OT)是数学领域的一个分支,关注的是在两个概率测度之间以最小努力进行传输。在古典的最优传输中,一个测度到自身的最优传输策略是恒等映射。在本文中,我们通过强迫样本转移其质量,同时保持最小努力的目标来解决异常检测问题。我们称这一新的传输问题为质量排斥最优传输(MROT)。自然地,位于空间低密度区域的样本将被迫转移大量质量,导致更高的传输成本。我们利用这些概念设计了一种新的异常值评分方法。通过在现有基准和故障检测问题上的一系列实验,我们展示了我们的算法在现有方法上有所改进。