LLM2D

摘要

arXiv:2412.01365v2 宣告类型: replace-cross 摘要：深度学习在处理和管理非结构化数据方面取得了显著的成功。然而，其“黑箱”性质对其造成了显著的限制，特别是在敏感的应用领域。虽然现有的可解释机器学习方法解决了一些这些问题，但它们往往未能充分考虑特征之间的相关性，并且对模型决策路径的评估也不充分。为了克服这些挑战，本文介绍了Real Explainer（RealExp），一种解释计算方法，将Shapley值解耦为个体特征的重要性及其相关性的重要性。通过结合特征相似性计算，RealExp通过精确量化个体特征的贡献及其相互作用来增强解释性，从而提供更可靠和细腻的解释。此外，本文还提出了一种新的解释性评价标准，旨在阐明深度学习模型的决策路径，超越传统的基于准确性的度量标准。在两个非结构化数据任务——图像分类和文本情感分析——上的实验验证表明，RealExp在解释性方面显著优于现有方法。案例研究进一步说明了其实用价值：在图像分类中，RealExp有助于从解释性角度选择适合特定任务的预训练模型；在文本分类中，它能够优化模型，并使用传统的词袋方法近似fine-tuned的GPT-Ada模型的性能。