摘要
arXiv:2504.02670v2 公告类型:更换
摘要:大型语言模型(LLMs)正在重塑能够跨领域执行多种任务的AI助手的发展。然而,当前最先进的LLM驱动的智能体面临着重大挑战,包括高昂的操作成本以及在GAIA等复杂基准测试中较低的成功率。为了解决这些问题,我们提出了思辨知识图谱(KGoT),这是一种创新的AI助手架构,将LLM推理与动态构建的知识图谱(KGs)相结合。KGoT将与任务相关的知识提取并结构化为动态KG表示,并通过外部工具如数学求解器、网络爬虫和Python脚本进行迭代增强。这种结构化的任务相关信息的表示使得低成本模型能够有效解决复杂任务。例如,KGoT在GAIA基准测试上的任务成功率相较于Hugging Face Agents中的GPT-4o mini提高了29%,而与GPT-4o相比,成本降低了超过36倍。对于最近的推理模型,提升相似,例如,Qwen2.5-32B和Deepseek-R1-70B分别提高了36%和37.5%。KGoT提供了一种可扩展、经济实惠且高性能的AI助手解决方案。