摘要
arXiv:2503.23205v1 宣告类型: cross
摘要: 知识图谱完成(KGC)旨在通过推理补充知识图谱(KGs)中的缺失信息,以解决其固有的不完整性问题。传统基于结构的方法虽然有效,但由于需要进行密集嵌入学习,并且需要为每次预测中的KG中的所有实体进行评分,因此面临显著的计算需求和扩展性挑战。最近使用语言模型如T5和BERT的基于文本的方法通过将KG三元组转换为文本以进行推理,缓解了这些问题。然而,它们往往未能充分利用上下文信息,主要集中在实体的邻域上,忽视了关系的上下文。为了解决这一问题,我们提出了一种KGC-ERC框架,该框架结合了两种类型的上下文,以增强生成语言模型的输入,并提高其推理能力。此外,我们引入了一种采样策略,在输入标记约束条件下有效选择相关上下文,这优化了上下文信息的利用,并可能提高模型性能。在Wikidata5M、Wiki27K和FB15K-237-N数据集上的实验结果显示,KGC-ERC在预测性能和扩展性方面优于或匹配了最先进的基线模型。