摘要
arXiv:2504.08602v1 宣布类型: 交叉
摘要: 概念驱动的可解释人工智能(C-XAI)这一繁荣的研究领域探讨了人类可解释语义概念如何嵌入深度神经网络(DNN)的潜在空间中。其中的后验方法使用一组示例来指定一个概念,并利用数据驱动的方法确定其在DNN潜在空间中的嵌入。这种方法已被证明有助于揭示不同目标(前景或概念)类别之间的偏差。然而,由于在训练过程中背景主要不受控制,到目前为止一个重要问题尚未得到解答:最先进的数据驱动的后验C-XAI方法本身是否容易受到背景偏差的影响?例如,野生动物主要出现在植被背景中,很少出现在道路上。即使是最简单和最稳健的C-XAI方法也可能会利用这种捷径以提高性能。因此,道路场景中动物概念的性能退化可能会被忽视。本研究验证并彻底确认,成熟的基于Net2Vec的概念分割技术频繁地捕获背景偏差,包括令人担忧的偏差,如在道路场景上的表现不佳。为进行分析,我们在两个数据集的50多个概念上比较了领域内3种背景随机化技术,以及7种不同的DNN架构。结果显示,即使低成本设置也能提供有价值的信息,并提高背景的鲁棒性。