LLM2D

摘要

最近开发的检索增强生成（RAG）技术使得构建领域特定的应用程序变得高效。然而，它也存在一些局限性，包括向量相似性与知识推理相关性之间的差距，以及对诸如数值、时间关系、专家规则等知识逻辑的不敏感性，这些都影响了专业知识服务的效果。在这项工作中，我们介绍了一种名为知识增强生成（KAG）的专业领域知识服务框架。KAG旨在解决上述挑战，充分利用知识图谱（KG）和向量检索的优势，通过以下五个关键方面双向增强大型语言模型（LLM）和KG，以提高生成和推理性能：(1) 友好的知识表示，(2) 知识图谱与原始块之间的互相索引，(3) 逻辑形式引导的混合推理引擎，(4) 知识与语义推理的对齐，以及(5) KAG模型能力的提升。我们在多跳问答中将KAG与现有的RAG方法进行了比较，发现其显著优于当前最先进的方法，在2wiki上F1得分相对提升了19.6%，在hotpotQA上提升了33.5%。我们已成功将KAG应用于蚂蚁集团的两个专业知识问答任务，包括电子政务问答和电子健康问答，与RAG方法相比，在专业性上取得了显著提升。