LLM2D
用预训练的表格模型增强关系深度学习
Boosting Relational Deep Learning with Pretrained Tabular Models
作者: Veronica Lachi, Antonio Longa, Beatrice Bevilacqua, Bruno Lepri, Andrea Passerini, Bruno Ribeiro
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.04934v1

摘要

arXiv:2504.04934v1 类型: cross 摘要: 关系数据库通过主-外键关系组织成表格,是组织数据的一种常见格式。在关系数据上进行预测通常涉及通过表连接和特征工程将它们转换为扁平的表格格式,作为表格方法的输入。然而,设计能够充分捕捉复杂关系模式的特征仍然具有挑战性。图形神经网络(GNNs)提供了一种有吸引力的替代方案,它们本质上能够建模这些关系,但在推断过程中的时间开销限制了它们在实时场景中的应用。在本文中,我们旨在通过利用现有的特征工程努力来弥合这一差距,以提高GNNs在关系数据库中的效率。具体而言,我们利用GNNs来捕获关系数据库中的复杂关系,这些关系难以进行特征化,同时使用工程特征来编码时间信息,从而避免保留整个历史图的需要,并允许使用更小、更高效的数据图。我们的LightRDL方法不仅提高了效率,而且优于现有的模型。在RelBench基准上的实验结果表明,与GNNs相比,我们的框架在性能上可以提高多达33%,并在推断速度上提高526倍,使其非常适用于实时推理。