LLM2D

摘要

尽管深度神经网络在安全关键决策中应用日益广泛，但其固有的黑盒性质阻碍了透明度和可解释性。因此，可解释人工智能 (XAI) 方法应运而生，旨在理解模型的内部运作机制，尤其是归因方法，也称为显著性图。传统的归因方法通常识别输入中重要区域的位置——即“哪里”。然而，由于这些方法忽略了输入数据的固有结构，因此它们往往无法解释这些区域在结构成分（例如图像中的纹理或声音中的瞬变）方面代表什么。此外，现有方法通常针对单一数据模态，限制了它们的通用性。在本文中，我们建议利用小波域作为归因的稳健数学基础。我们的方法，即小波归因方法 (WAM)，将现有的基于梯度的特征归因扩展到小波域，为跨图像、音频和 3D 形状解释分类器提供了一个统一框架。实证评估表明，WAM 在图像、音频和 3D 可解释性的忠实度指标和模型方面与最先进方法相匹配或超越了最先进方法。最后，我们展示了我们的方法如何不仅解释“哪里”——输入的重要部分，还解释“什么”——结构成分方面的相关模式。