LLM2D
Wasserstein 距离的可解释性增强:关于数据集偏移和传输现象的 Insights
Wasserstein Distances Made Explainable: Insights into Dataset Shifts and Transport Phenomena
作者: Philip Naumann, Jacob Kauffmann, Gr\'egoire Montavon
发布日期: 5/12/2025
arXiv ID: oai:arXiv.org:2505.06123v1

摘要

arXiv:2505.06123v1 类型: cross 摘要: Wasserstein 距离提供了一种强大的框架,用于比较数据分布。它们可以用于分析时间过程或检测数据中的不均匀性。然而,简单地计算 Wasserstein 距离或分析相应的运输映射(或耦合)可能不足以了解哪些因素导致较高的或较低的 Wasserstein 距离。在本文中,我们提出了一种基于可解释人工智能的新型解决方案,该解决方案使我们能够高效准确地将 Wasserstein 距离归因于各种数据组件,包括数据子组、输入特征或可解释的子空间。我们的方法在多种数据集和 Wasserstein 距离规范上实现了高精度,并通过两个实际案例展示了其实用价值。