LLM2D

摘要

arXiv:2412.09094v3 宣告类型: 替换-交叉摘要：大规模语言模型（LLMs）具备巨大的内在知识和卓越的语义理解能力，这已经彻底改变了自然语言处理中各种任务。尽管取得了成功，但使LLMs执行知识图谱补全（KGC）仍然存在一个关键的差距。实验证据表明，即使通过复杂的提示设计或定制指令调优，LLMs在KGC任务上的表现也普遍劣于传统的方法。从根本上讲，在KGC任务中应用LLMs引入了几个关键挑战，包括大量实体候选、LLMs的幻觉问题以及图形结构的过度利用不足。为了解决这些挑战，我们提出了一种新型的基于指令调优的方法，即FtG。具体而言，我们提出了一种过滤-生成的范式，并将KGC任务形式化为一个多项选择题格式。这样一来，我们可以在减轻由幻觉引起的问题的同时利用LLMs的能力。此外，我们设计了一个灵活的自我图序列化提示，并采用结构-文本适配器以上下文相关的方式结合结构和文本信息。实验结果表明，FtG相比现有最先进的方法在性能上实现了显著的提升。数据集和代码可在https://github.com/LB0828/FtG获取。