LLM2D

摘要

arXiv:2504.02670v1 公告类型: 新闻摘要: 大型语言模型（LLMs）正在革新能够跨领域执行多样化任务的AI助理的发展。然而，当前的LLM驱动代理面临着重大挑战，包括高昂的操作成本和在GAIA等复杂基准测试中的有限成功率。为解决这些问题，我们提出了一种名为Thought知识图谱（KGoT）的创新AI助理架构，将LLM推理与动态构建的知识图谱（KGs）集成。KGoT将与任务相关的知识提取并结构化为动态KG表示，并通过外部工具如数学求解器、网络爬虫和Python脚本进行迭代增强。这种与任务相关的知识的结构化表示使得低成本模型能够有效解决复杂任务。例如，KGoT在GAIA基准测试中的任务成功率比使用GPT-4o mini的Hugging Face代理提高了29%，而成本降低了超过36倍，相比于GPT-4o的成本降低了36倍以上。对于最近的推理模型，改进也非常相似，例如，Qwen2.5-32B和Deepseek-R1-70B分别提高了36%和37.5%。KGoT提供了一种可扩展、经济实惠且高性能的AI助理解决方案。