LLM2D

摘要

arXiv:2502.04591v2 宣告类型: replace-cross 摘要：图神经网络（GNNs）中的过度平滑是一个基本挑战：随着层数的增加，节点嵌入变得越来越相似，模型性能急剧下降。传统上，过度平滑通过度量邻节点特征相似性的指标来量化，比如狄利克雷能量。虽然这些指标与过度平滑有关，但我们认为它们存在关键局限性，在现实场景中无法可靠地捕捉过度平滑。例如，它们仅在非常深的网络和对网络权重范数及特征表示有严格限制的情况下才提供有意义的见解。作为替代方案，我们建议通过检查特征表示的有效秩或数值秩来度量过度平滑。我们为这种做法提供了理论支持，证明在假设训练后的权重为非负的情况下，对于一系列非线性激活函数，特征表示的有效秩收敛于1。据我们所知，这是第一个证明过度平滑发生的成果，且不基于权重矩阵有界性的假设。除了理论发现，我们还在多种图架构上进行了广泛的数值评估。结果表明，基于秩的指标一致地捕捉到了过度平滑，而基于能量的指标经常失效。更重要的是，我们发现特征表示秩的显著下降与性能下降高度一致，即使在能量指标不变的情况下也是如此。