LLM2D
面向数据导向的图学习:一种基于熵的方法
Toward Data-centric Directed Graph Learning: An Entropy-driven Approach
作者: Xunkai Li, Zhengyu Wu, Kaichi Yu, Hongchao Qin, Guang Zeng, Rong-Hua Li, Guoren Wang
发布日期: 5/5/2025
arXiv ID: oai:arXiv.org:2505.00983v1

摘要

arXiv:2505.00983v1 Announce Type: cross 摘要:有向图(有向图),作为无向图的推广,在建模复杂拓扑系统方面表现出卓越的表示能力,并且近年来引起了相当大的关注。尽管现有的有向图神经网络(DiGNNs)已经试图利用有向边,但它们仍然未能全面探索有向图中隐藏的丰富数据知识。这种数据层面的限制导致模型层面的预测性能欠佳,并强调了从数据导向的角度进一步探索有向边(拓扑)与节点配置文件(特征和标签)之间的潜在关联的必要性,从而增强以模型为中心的神经网络的编码能力。 在这篇论文中,我们提出了**E**算**D**法驱**E**动的**N**图知识提炼(EDEN),它可以作为数据导向的有向图学习范式或一个模型无关的插拔式数据导向的知识提炼(KD)模块。核心思想是通过我们提出的层次编码理论来实现数据导向的机器学习,该理论用于结构化数据。具体而言,EDEN 首先从拓扑视角利用有向结构度量来构建粗粒度的层次知识树(HKT)。随后,EDEN 量化节点配置文件之间的互信息以在 HKT 中细化知识流,从而在模型训练中实现数据导向的 KD 监督。作为一种通用框架,EDEN 也可以自然地扩展到无向场景并表现出令人满意的表现。在我们的实验中,EDEN 已经在 14 个(有向)图数据集中(同质性和异质性)以及 4 个下游任务中进行了广泛评估。结果表明,EDEN 获得了最先进的性能,并显著改进了流行的(有向)图神经网络。