摘要
近年来,训练数据归因 (TDA) 方法作为神经网络可解释性的一种有前景的方向而出现。虽然围绕 TDA 的研究蓬勃发展,但致力于评估归因的工作却有限。类似于为传统的特征归因方法开发评估指标,已经提出了一些独立的指标来评估 TDA 方法在各种环境下的质量。然而,缺乏一个允许系统比较的统一框架,限制了对 TDA 方法的信任,并阻碍了其广泛应用。为了解决这一研究空白,我们引入了 Quanda,这是一个旨在促进 TDA 方法评估的 Python 工具包。Quanda 不仅提供了一套全面的评估指标,还提供了一个统一的接口,可以与不同存储库中现有的 TDA 实现无缝集成,从而实现系统的基准测试。该工具包易于使用,经过全面测试,文档齐全,并作为开源库在 PyPi 和 https://github.com/dilyabareeva/quanda 上提供。