摘要
arXiv:2504.02685v1 Announce Type: cross
摘要:分布外(OOD)检测是机器学习中的一个关键任务,特别是在模型失败可能导致严重后果的安全敏感应用中。然而,现有的OOD检测方法常常受制于严格的分布假设、有限的可扩展性和缺乏可解释性。为了解决这些挑战,我们提出了一种STOOD-X两阶段方法,该方法结合了统计非参数测试进行OOD检测,并增强了可解释性。在第一阶段,STOOD-X使用特征空间距离和威尔科克森-曼—惠特尼检验来识别OOD样本,而无需假设特定的特征分布。在第二阶段,它生成用户友好的概念基础视觉解释,揭示了每个决策所依赖的特征,并与BLUE XAI范式保持一致。通过在基准数据集和多种架构上的广泛实验,STOOD-X在与最先进的事后OOD检测器相比时,在高维和复杂设置中实现了竞争性的性能。此外,其可解释性框架使人类监督、偏差检测和模型调试成为可能,促进了人类与AI系统的信任和协作。因此,STOOD-X方法为现实世界的OOD检测任务提供了一个稳健、可解释且可扩展的解决方案。