LLM2D

摘要

arXiv:2505.06745v1 交叉类型：cross 摘要：最近的神经符号方法成功地从基于CNN的模型中提取出符号规则集，以提高可解释性。然而，由于Vision Transformers (ViTs)缺乏模块化概念检测器并依赖于全局自注意力机制，将类似的技术应用于ViTs仍然具有挑战性。我们提出了一种从ViTs中提取符号规则的方法，通过引入受稀疏自编码器(SAEs)启发的稀疏概念层。这个线性层在注意力加权的补丁表示上操作，并学习一种解耦的二元表示，在这种表示中，个体神经元激活与高级视觉概念相关。为了促进可解释性，我们应用了L1稀疏性约束、熵最小化和监督对比损失的组合。这些二元概念激活被用作FOLD-SE-M算法的输入，该算法以逻辑程序的形式生成规则集。我们的方法在标准ViT上实现了5.14%更高的分类准确性，同时支持符号推理。重要的是，提取出的规则集不仅是事后解释的，而是作为基于逻辑的决策层直接作用于稀疏概念表示。生成的程序简洁且语义明确。这是首次使用稀疏符号表示从ViTs中提取可执行逻辑程序的工作。它填补了基于变换器的视觉模型和符号逻辑编程之间的空白，为更具可解释性和验证性的神经符号AI提供了一步进展。