摘要
arXiv:2412.01365v2 宣告类型: replace-cross
摘要:深度学习在处理和管理非结构化数据方面取得了显著的成功。然而,其“黑箱”性质对其造成了显著的限制,特别是在敏感的应用领域。虽然现有的可解释机器学习方法解决了一些这些问题,但它们往往未能充分考虑特征之间的相关性,并且对模型决策路径的评估也不充分。为了克服这些挑战,本文介绍了Real Explainer(RealExp),一种解释计算方法,将Shapley值解耦为个体特征的重要性及其相关性的重要性。通过结合特征相似性计算,RealExp通过精确量化个体特征的贡献及其相互作用来增强解释性,从而提供更可靠和细腻的解释。此外,本文还提出了一种新的解释性评价标准,旨在阐明深度学习模型的决策路径,超越传统的基于准确性的度量标准。在两个非结构化数据任务——图像分类和文本情感分析——上的实验验证表明,RealExp在解释性方面显著优于现有方法。案例研究进一步说明了其实用价值:在图像分类中,RealExp有助于从解释性角度选择适合特定任务的预训练模型;在文本分类中,它能够优化模型,并使用传统的词袋方法近似fine-tuned的GPT-Ada模型的性能。