摘要
图神经网络 (GNN) 越来越流行,用于有效地对具有图结构的数据进行建模。近年来,注意力机制被集成到 GNN 中,以提高其捕获复杂模式的能力。本文首次全面研究了这种集成带来的一个关键且未被探索的后果:注意力层中出现了大量激活 (MA)。我们介绍了一种新的方法来检测和分析 MA,重点关注不同图变换器架构中的边特征。我们的研究使用基准数据集(包括 ZINC、TOX21 和 PROTEINS)评估了各种 GNN 模型。主要贡献包括:(1) 建立了 GNN 中注意力机制与 MA 生成之间的直接联系;(2) 基于激活比分布,开发了 MA 的稳健定义和检测方法;(3) 引入显式偏差项 (EBT) 作为一种潜在的应对措施,并将其探索为一种对抗性框架,以根据 MA 的存在与否来评估模型的鲁棒性。我们的发现突出了注意力诱导的 MA 在不同架构(如 GraphTransformer、GraphiT 和 SAN)中的普遍性和影响。该研究揭示了注意力机制、模型架构、数据集特征和 MA 出现之间的复杂相互作用,为开发更强大和可靠的图模型提供了重要见解。