LLM2D
先过滤后生成:带有结构-文本适配器的大规模语言模型在知识图谱补全中的应用
Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph Completion
作者: Ben Liu, Jihai Zhang, Fangquan Lin, Cheng Yang, Min Peng
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2412.09094v3

摘要

arXiv:2412.09094v3 宣告类型: 替换-交叉 摘要:大规模语言模型(LLMs)具备巨大的内在知识和卓越的语义理解能力,这已经彻底改变了自然语言处理中各种任务。尽管取得了成功,但使LLMs执行知识图谱补全(KGC)仍然存在一个关键的差距。实验证据表明,即使通过复杂的提示设计或定制指令调优,LLMs在KGC任务上的表现也普遍劣于传统的方法。从根本上讲,在KGC任务中应用LLMs引入了几个关键挑战,包括大量实体候选、LLMs的幻觉问题以及图形结构的过度利用不足。为了解决这些挑战,我们提出了一种新型的基于指令调优的方法,即FtG。具体而言,我们提出了一种过滤-生成的范式,并将KGC任务形式化为一个多项选择题格式。这样一来,我们可以在减轻由幻觉引起的问题的同时利用LLMs的能力。此外,我们设计了一个灵活的自我图序列化提示,并采用结构-文本适配器以上下文相关的方式结合结构和文本信息。实验结果表明,FtG相比现有最先进的方法在性能上实现了显著的提升。数据集和代码可在https://github.com/LB0828/FtG获取。