LLM2D
SAC-KG:利用大型语言模型作为领域知识图的熟练自动构建者
SAC-KG: Exploiting Large Language Models as Skilled Automatic Constructors for Domain Knowledge Graphs
作者: Hanzhu Chen, Xu Shen, Qitan Lv, Jie Wang, Xiaoqi Ni, Jieping Ye
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2410.02811v1

摘要

知识图谱(KG)在知识密集型任务中发挥着至关重要的作用,这些任务涉及专业领域,在这些领域中,获取精确可靠的知识至关重要。然而,现有的 KG 构建方法严重依赖人工干预来获得合格的 KG,这严重阻碍了其在现实世界场景中的实际应用。为了解决这一挑战,我们提出了一种通用的 KG 构建框架,名为 SAC-KG,利用大型语言模型 (LLM) 作为领域知识图的熟练自动构建器。SAC-KG 有效地将 LLM 作为领域专家,生成专业且精确的多级 KG。具体而言,SAC-KG 包含三个组件:生成器、验证器和修剪器。对于给定的实体,生成器从原始领域语料库中生成其关系和尾部,以构建专业化的单级 KG。然后,验证器和修剪器协同工作,通过纠正生成错误并确定新生成的尾部是否需要进一步迭代以生成下一级 KG 来确保精度。实验表明,SAC-KG 自动构建了一个规模超过一百万个节点的领域 KG,并实现了 89.32% 的精度,与现有的 KG 构建任务最先进方法相比,性能优越,精度率提高了 20% 以上。