LLM2D

摘要

深度学习方法在时间序列领域日益普及，激发了人们对可解释性研究的兴趣，其中包括反事实（CF）方法。CF 方法旨在识别实例中的最小变化，以改变模型预测。尽管研究广泛，但目前尚无工作对时间序列领域中的 CF 方法进行基准测试。此外，由于数据集数量有限和指标不足，文献中报道的结果并不确定。在本研究中，我们重新设计了定量指标，以准确地捕捉 CF 中的理想特征。我们专门重新设计了稀疏性和合理性的指标，并引入了一个新的指标来衡量一致性。结合有效性、生成时间和邻近性，我们形成了一个全面的指标集。我们系统地对 20 个单变量数据集和 10 个多变量数据集上的 6 种不同的 CF 方法进行了基准测试，并使用了 3 种不同的分类器。结果表明，CF 方法的性能在不同指标和不同模型之间存在差异。最后，我们提供了案例研究和实用指南。