LLM2D
RACOON:基于LLM的检索增强知识图谱列类型标注框架
RACOON: An LLM-based Framework for Retrieval-Augmented Column Type Annotation with a Knowledge Graph
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.14556v1

摘要

arXiv:2409.14556v1 公告类型: 交叉 摘要: 作为数据探索和集成的重要组成部分,列类型标注(Column Type Annotation, CTA)旨在为一个表格的列标注一个或多个语义类型。随着大型语言模型(Large Language Models, LLMs)的最新发展,研究人员开始探索利用LLMs进行CTA的可能性,利用其强大的零样本能力。在本文中,我们在这一有前景的工作基础上,通过展示如何使用知识图谱(Knowledge Graph, KG)来增强提供给LLM的上下文信息,改进了基于LLM的CTA方法。我们的方法称为RACOON,在生成过程中结合了预训练的参数化和非参数化知识,以提高LLMs在CTA上的性能。我们的实验表明,与纯LLM推理相比,RACOON实现了高达0.21的微F1改进。