LLM2D

摘要

arXiv:2504.02685v1 Announce Type: cross 摘要：分布外（OOD）检测是机器学习中的一个关键任务，特别是在模型失败可能导致严重后果的安全敏感应用中。然而，现有的OOD检测方法常常受制于严格的分布假设、有限的可扩展性和缺乏可解释性。为了解决这些挑战，我们提出了一种STOOD-X两阶段方法，该方法结合了统计非参数测试进行OOD检测，并增强了可解释性。在第一阶段，STOOD-X使用特征空间距离和威尔科克森-曼—惠特尼检验来识别OOD样本，而无需假设特定的特征分布。在第二阶段，它生成用户友好的概念基础视觉解释，揭示了每个决策所依赖的特征，并与BLUE XAI范式保持一致。通过在基准数据集和多种架构上的广泛实验，STOOD-X在与最先进的事后OOD检测器相比时，在高维和复杂设置中实现了竞争性的性能。此外，其可解释性框架使人类监督、偏差检测和模型调试成为可能，促进了人类与AI系统的信任和协作。因此，STOOD-X方法为现实世界的OOD检测任务提供了一个稳健、可解释且可扩展的解决方案。