LLM2D

摘要

图神经网络 (GNN) 越来越流行，用于有效地对具有图结构的数据进行建模。近年来，注意力机制被集成到 GNN 中，以提高其捕获复杂模式的能力。本文首次全面研究了这种集成带来的一个关键且未被探索的后果：注意力层中出现了大量激活 (MA)。我们介绍了一种新的方法来检测和分析 MA，重点关注不同图变换器架构中的边特征。我们的研究使用基准数据集（包括 ZINC、TOX21 和 PROTEINS）评估了各种 GNN 模型。主要贡献包括：(1) 建立了 GNN 中注意力机制与 MA 生成之间的直接联系；(2) 基于激活比分布，开发了 MA 的稳健定义和检测方法；(3) 引入显式偏差项 (EBT) 作为一种潜在的应对措施，并将其探索为一种对抗性框架，以根据 MA 的存在与否来评估模型的鲁棒性。我们的发现突出了注意力诱导的 MA 在不同架构（如 GraphTransformer、GraphiT 和 SAN）中的普遍性和影响。该研究揭示了注意力机制、模型架构、数据集特征和 MA 出现之间的复杂相互作用，为开发更强大和可靠的图模型提供了重要见解。