摘要
最近开发的检索增强生成(RAG)技术使得构建领域特定的应用程序变得高效。然而,它也存在一些局限性,包括向量相似性与知识推理相关性之间的差距,以及对诸如数值、时间关系、专家规则等知识逻辑的不敏感性,这些都影响了专业知识服务的效果。在这项工作中,我们介绍了一种名为知识增强生成(KAG)的专业领域知识服务框架。KAG旨在解决上述挑战,充分利用知识图谱(KG)和向量检索的优势,通过以下五个关键方面双向增强大型语言模型(LLM)和KG,以提高生成和推理性能:(1) 友好的知识表示,(2) 知识图谱与原始块之间的互相索引,(3) 逻辑形式引导的混合推理引擎,(4) 知识与语义推理的对齐,以及(5) KAG模型能力的提升。我们在多跳问答中将KAG与现有的RAG方法进行了比较,发现其显著优于当前最先进的方法,在2wiki上F1得分相对提升了19.6%,在hotpotQA上提升了33.5%。我们已成功将KAG应用于蚂蚁集团的两个专业知识问答任务,包括电子政务问答和电子健康问答,与RAG方法相比,在专业性上取得了显著提升。