LLM2D

摘要

arXiv:2502.01048v1 交叉类型论文摘要：该论文探讨了通过分析和建模深度神经网络利用的特征来提高计算机视觉解释性的先进方法。首先，通过对归因方法，尤其是显著图，进行评估，引入了一个基于算法稳定性的度量标准，并采用Sobol指数的方法，通过准蒙特卡洛序列，显著减少了计算时间。此外，EVA方法提供了通过形式化验证扰动分析的第一种归因形式表述。实验结果显示，在复杂场景中，这些方法无法提供足够的理解，特别是因为它们仅能识别“模型集中在何处”而不解释“模型感知到什么”。因此，提出了两个假设：通过引入整合人类解释模仿和1-Lipschitz函数空间优化的训练过程，使模型与人类推理相一致；采用概念解释方法。提出了CRAFT方法来自动化提取模型使用的概念及其重要性的评估，并通过MACO使其可视化。这些工作朝着统一框架的方向发展，该框架通过应用于ResNet模型的1000个ImageNet类别中的交互式演示得到了体现。