摘要
深度学习方法在时间序列领域日益普及,激发了人们对可解释性研究的兴趣,其中包括反事实(CF)方法。CF 方法旨在识别实例中的最小变化,以改变模型预测。尽管研究广泛,但目前尚无工作对时间序列领域中的 CF 方法进行基准测试。此外,由于数据集数量有限和指标不足,文献中报道的结果并不确定。在本研究中,我们重新设计了定量指标,以准确地捕捉 CF 中的理想特征。我们专门重新设计了稀疏性和合理性的指标,并引入了一个新的指标来衡量一致性。结合有效性、生成时间和邻近性,我们形成了一个全面的指标集。我们系统地对 20 个单变量数据集和 10 个多变量数据集上的 6 种不同的 CF 方法进行了基准测试,并使用了 3 种不同的分类器。结果表明,CF 方法的性能在不同指标和不同模型之间存在差异。最后,我们提供了案例研究和实用指南。