LLM2D
视觉转换器中注意力引导稀疏表示的符号规则提取
Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers
作者: Parth Padalkar, Gopal Gupta
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06745v1

摘要

arXiv:2505.06745v1 交叉类型:cross 摘要:最近的神经符号方法成功地从基于CNN的模型中提取出符号规则集,以提高可解释性。然而,由于Vision Transformers (ViTs)缺乏模块化概念检测器并依赖于全局自注意力机制,将类似的技术应用于ViTs仍然具有挑战性。我们提出了一种从ViTs中提取符号规则的方法,通过引入受稀疏自编码器(SAEs)启发的稀疏概念层。这个线性层在注意力加权的补丁表示上操作,并学习一种解耦的二元表示,在这种表示中,个体神经元激活与高级视觉概念相关。为了促进可解释性,我们应用了L1稀疏性约束、熵最小化和监督对比损失的组合。这些二元概念激活被用作FOLD-SE-M算法的输入,该算法以逻辑程序的形式生成规则集。我们的方法在标准ViT上实现了5.14%更高的分类准确性,同时支持符号推理。重要的是,提取出的规则集不仅是事后解释的,而是作为基于逻辑的决策层直接作用于稀疏概念表示。生成的程序简洁且语义明确。这是首次使用稀疏符号表示从ViTs中提取可执行逻辑程序的工作。它填补了基于变换器的视觉模型和符号逻辑编程之间的空白,为更具可解释性和验证性的神经符号AI提供了一步进展。