LLM2D

摘要

arXiv:2408.01697v2 宣布类型: 替换交叉摘要：图数据的离域外泛化（Graph Out-of-Distribution, GOOD）仍然是图学习中的一个主要挑战，因为图神经网络（GNNs）在分布转移下常常表现出严重的性能退化。不变学习（Invariant Learning），旨在提取不同分布下的不变特征，最近已经作为一种有前途的方法出现，用于处理OOD生成问题。尽管不变学习在欧几里得数据（例如，图像）的OOD问题上取得了巨大的成功，但在图数据中对其的探索仍然受到图的复杂性质的限制。现有研究，如数据增强或因果干预，要么在图操作过程中破坏不变性，要么由于缺乏用于因果部分的监督信号而导致可靠性问题。在本文中，我们提出了一种新的框架，称为基于信息瓶颈理论的不变图学习（InfoIGL），以提取图的不变特征并增强模型对未见分布的泛化能力。具体而言，InfoIGL 引入了一个冗余过滤器，用于压缩与环境因素无关的任务信息。结合我们设计的多层次对比学习，我们在下游分类任务中最大化相同类别图之间的互信息，极大地保留了用于预测的不变特征。InfoIGL 的一个吸引人的特点是，它在不依赖于不变性的监督信号的情况下具有很强的泛化能力。在合成数据集和真实世界数据集上的实验结果表明，我们的方法在图分类任务中的OOD泛化性能达到了最先进的水平。源代码可在 https://github.com/maowenyu-11/InfoIGL 获取。