LLM2D
Griffin: 向图为中心的关系数据库基础模型迈进
Griffin: Towards a Graph-Centric Relational Database Foundation Model
作者: Yanbo Wang, Xiyuan Wang, Quan Gan, Minjie Wang, Qibin Yang, David Wipf, Muhan Zhang
发布日期: 5/12/2025
arXiv ID: oai:arXiv.org:2505.05568v1

摘要

arXiv:2505.05568v1 类型:交叉 摘要:我们引入了Griffin,这是首个专门针对关系数据库(RDBs)的基石模型尝试。与之前专注于单一RDB任务的小型模型不同,Griffin统一了数据编码器和任务解码器,以处理多样化的任务。此外,我们通过引入交叉注意力模块和新颖的聚合器,增强了该架构。Griffin在单表和RDB数据集中进行了预训练,使用高级编码器处理分类、数值和元数据特征,并结合交叉注意力模块和增强的图神经网络(MPNNs)等创新组件,以捕捉关系数据的复杂性。在跨越15000万个节点、多种领域(涉及多个领域)的大规模、异构和时序图中进行评估,Griffin在单个任务模型上的性能表现出优越或可比性,特别是在数据量不足的场景下表现出色,并且在预训练跨新数据集和任务中的相似性和多样性方面显示出强大的迁移能力,这突显了其作为适用于RDBs的通用基石模型的潜力。代码详见https://github.com/yanxwb/Griffin。