摘要
近年来,各种各样的图神经网络(GNN)架构层出不穷,每种架构都有其自身的优势、劣势和复杂性。为了提高 GNN 的性能,人们采用了各种技术,包括重连、提升和使用中心度值对节点进行标注作为预处理步骤。然而,目前还没有公认的最佳实践,而且架构和预处理对性能的影响往往不透明。
本研究系统地探讨了各种图变换作为预处理步骤对标准数据集上常用 GNN 架构性能的影响。模型的评估基于其区分非同构图的能力,称为表达能力。
我们的研究结果表明,某些变换,特别是那些用中心度度量增强节点特征的变换,始终能提高表达能力。然而,这些收益伴随着权衡,例如,图编码方法虽然提高了表达能力,但也引入了广泛使用的 Python 包中的数值误差。此外,我们观察到,这些预处理技术在处理涉及 3-WL 和 4-WL 不可区分图的复杂任务时,效果有限。