摘要
arXiv:2409.13731v1 公告类型: 交叉 摘要: 最近开发的检索增强生成(RAG)技术能够高效构建特定领域应用。然而,它面临模糊检索过程、通用语言模型理解和推理能力的"幻觉"问题以及复杂系统中的级联损失等局限。这些挑战阻碍了专业知识服务的有效性。然而,在科学计算、医学和法律等领域,知识的准确性、信息的完整性以及规则、时间和价值的逻辑严谨性尤为关键。我们引入专业领域知识服务框架:知识增强生成(KAG),通过双向增强大型语言模型(LLM)和知识图谱(KG),包括五个关键增强:1)LLM友好的知识语义表示,2)知识图谱与原始块之间的相互索引,3)逻辑形式引导的混合推理和求解,4)基于语义推理的知识对齐,5)KAG模型。我们在多跳问答中比较了KAG与现有RAG方法。结果显示,KAG显著优于最先进的方法,F1相对提升19.6%至33.4%。我们将KAG应用于蚂蚁集团的两个专业知识问答任务,包括政务问答和健康问答,与NaiveRAG相比,专业性显著提升。我们将在开源KG引擎OpenSPG上原生支持KAG,使开发者更容易构建严谨的知识决策或便捷的信息检索服务。