摘要
arXiv:2408.01697v2 宣布类型: 替换交叉
摘要:图数据的离域外泛化(Graph Out-of-Distribution, GOOD)仍然是图学习中的一个主要挑战,因为图神经网络(GNNs)在分布转移下常常表现出严重的性能退化。不变学习(Invariant Learning),旨在提取不同分布下的不变特征,最近已经作为一种有前途的方法出现,用于处理OOD生成问题。尽管不变学习在欧几里得数据(例如,图像)的OOD问题上取得了巨大的成功,但在图数据中对其的探索仍然受到图的复杂性质的限制。现有研究,如数据增强或因果干预,要么在图操作过程中破坏不变性,要么由于缺乏用于因果部分的监督信号而导致可靠性问题。在本文中,我们提出了一种新的框架,称为基于信息瓶颈理论的不变图学习(InfoIGL),以提取图的不变特征并增强模型对未见分布的泛化能力。具体而言,InfoIGL 引入了一个冗余过滤器,用于压缩与环境因素无关的任务信息。结合我们设计的多层次对比学习,我们在下游分类任务中最大化相同类别图之间的互信息,极大地保留了用于预测的不变特征。InfoIGL 的一个吸引人的特点是,它在不依赖于不变性的监督信号的情况下具有很强的泛化能力。在合成数据集和真实世界数据集上的实验结果表明,我们的方法在图分类任务中的OOD泛化性能达到了最先进的水平。源代码可在 https://github.com/maowenyu-11/InfoIGL 获取。