LLM2D
时间序列分类深度学习模型的反事实可解释性基准测试
Benchmarking Counterfactual Interpretability in Deep Learning Models for Time Series Classification
作者: Ziwen Kan, Shahbaz Rezaei, Xin Liu
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:2408.12666v2

摘要

深度学习方法在时间序列领域日益普及,激发了人们对可解释性研究的兴趣,其中包括反事实(CF)方法。CF 方法旨在识别实例中的最小变化,以改变模型预测。尽管研究广泛,但目前尚无工作对时间序列领域中的 CF 方法进行基准测试。此外,由于数据集数量有限和指标不足,文献中报道的结果并不确定。在本研究中,我们重新设计了定量指标,以准确地捕捉 CF 中的理想特征。我们专门重新设计了稀疏性和合理性的指标,并引入了一个新的指标来衡量一致性。结合有效性、生成时间和邻近性,我们形成了一个全面的指标集。我们系统地对 20 个单变量数据集和 10 个多变量数据集上的 6 种不同的 CF 方法进行了基准测试,并使用了 3 种不同的分类器。结果表明,CF 方法的性能在不同指标和不同模型之间存在差异。最后,我们提供了案例研究和实用指南。