LLM2D

摘要

arXiv:2502.07968v1 Announce Type: cross 摘要：图中的离分布外（OOD）泛化旨在应对测试图分布与训练图分布不同的场景。尽管像图像这样的独立同分布数据使得离分布外泛化的挑战较为突出，但由于图结构数据的非独立同分布性质和复杂的结构性信息，图结构数据上的离分布外泛化问题仍然具有挑战性。最近，一些关于图的离分布外泛化的研究探索了提取在不同分布下共享关键分类信息的不变子图。然而，这种策略可能无法完全捕捉到不变信息，因为离散结构的提取可能会导致不变信息的丢失或引入伪信息。在本文中，我们提出了一种创新框架，称为生成风险最小化（GRM），旨在为每个待分类的输入图生成一个不变子图，而不是提取。为了解决在没有最优不变子图（即地面真值）的情况下优化的挑战，我们通过引入一个潜在的因果变量推导出了所提出的GRM目标的可处理形式，并通过我们的理论分析验证了其有效性。我们还在各种真实世界的图数据集上进行了广泛的实验，这些实验在节点级别和图级别上进行了离分布外泛化，结果表明了我们框架GRM的优越性。