LLM2D

摘要

arXiv:2202.03482v3 宣告类型: replace-cross 摘要：随着对神经网络预测策略理解的兴趣日益增长，概念激活向量（CAVs）已成为一种流行工具，用于在潜在空间中建模人类可理解的概念。通常，CAVs通过利用线性分类器来优化带有或不带有给定概念的样本的潜在表示的可分性来进行计算。然而，在本文中，我们展示了这种以可分性为导向的计算会导致偏离精准建模概念方向的实际目标。这种不一致性可以归因于干扰方向（即，与概念无关的信号）的巨大影响，这些信号被线性模型的滤波器（即，权重）拾取以优化类的可分性。为了解决这个问题，我们引入了基于模式的CAVs，专注于概念信号，从而提供更准确的概念方向。我们从CAVs与真实概念方向的对齐程度及其对CAVs应用的影响两个方面评估了各种CAV方法，包括概念敏感性测试和由于数据伪影引起的模型捷径行为的修正。我们使用VGG、ResNet、ReXNet、EfficientNet和Vision Transformer作为模型架构，在儿科骨龄、ISIC2019和FunnyBirds数据集上展示了基于模式的CAVs的益处。