LLM2D

摘要

图学习已成为包括推荐系统和社交网络分析在内的各个领域的关键技术。图神经网络 (GNN) 已成为编码结构信息并提高链接预测和节点分类等任务性能的有前景的技术。然而，一个关键挑战仍然存在：难以泛化到具有不同属性的未见图数据。在这项工作中，我们提出了一种新颖的图基础模型，称为 OpenGraph，以应对这一挑战。我们的方法解决了几个技术障碍。首先，我们利用大型语言模型 (LLM) 增强数据增强，以克服现实场景中的数据稀缺性。其次，我们引入了一种统一的图标记器，使模型能够有效地泛化到不同的图数据，即使在训练过程中遇到未见的属性也是如此。第三，我们开发的可扩展图转换器捕获全局拓扑上下文中的节点间依赖关系。大量的实验验证了我们框架的有效性。通过使 OpenGraph 适应新的图特性并理解不同的图，我们的方法在各种设置下实现了显著的零样本图学习性能。我们在 https://github.com/HKUDS/OpenGraph 发布了模型实现。