LLM2D

摘要

图模型能够捕捉实体之间错综复杂的连接关系，其中节点和边代表着这些连接。节点表示学习的目标是将节点转换为低维嵌入，这些嵌入通常被用作下游任务的特征。因此，嵌入的质量对任务性能有显著影响。现有的节点表示学习方法涵盖了（半）监督、无监督和自监督范式。在图领域，（半）监督学习通常只基于类别标签优化模型，而忽略了其他丰富的图信号，这限制了模型的泛化能力。虽然自监督或无监督学习产生的表示能更好地捕捉底层图信号，但这些捕捉到的信号对下游目标任务的有效性可能会有所不同。为了弥合这一差距，我们引入了目标感知对比学习（Target-aware CL），其目标是通过自监督学习过程最大化目标任务与节点表示之间的互信息，从而提高目标任务性能。这通过一种采样函数 XGBoost 采样器 (XGSampler) 来实现，该函数用于为我们提出的目标感知对比损失 (XTCL) 采样合适的正样本。通过最小化 XTCL，目标感知 CL 增加了目标任务与节点表示之间的互信息，从而提高了模型的泛化能力。此外，XGSampler 通过显示采样合适的正样本的权重来增强每个信号的可解释性。我们通过实验表明，与最先进的模型相比，XTCL 在两个目标任务上显著提高了性能：节点分类和链接预测任务。