LLM2D

摘要

arXiv:2503.23205v1 宣告类型: cross 摘要: 知识图谱完成（KGC）旨在通过推理补充知识图谱（KGs）中的缺失信息，以解决其固有的不完整性问题。传统基于结构的方法虽然有效，但由于需要进行密集嵌入学习，并且需要为每次预测中的KG中的所有实体进行评分，因此面临显著的计算需求和扩展性挑战。最近使用语言模型如T5和BERT的基于文本的方法通过将KG三元组转换为文本以进行推理，缓解了这些问题。然而，它们往往未能充分利用上下文信息，主要集中在实体的邻域上，忽视了关系的上下文。为了解决这一问题，我们提出了一种KGC-ERC框架，该框架结合了两种类型的上下文，以增强生成语言模型的输入，并提高其推理能力。此外，我们引入了一种采样策略，在输入标记约束条件下有效选择相关上下文，这优化了上下文信息的利用，并可能提高模型性能。在Wikidata5M、Wiki27K和FB15K-237-N数据集上的实验结果显示，KGC-ERC在预测性能和扩展性方面优于或匹配了最先进的基线模型。