摘要
arXiv:2502.04644v1 宣告类型: 新闻
摘要: 我们引入了代理推理框架,通过集成外部工具使用代理,增强了大型语言模型(LLM)的推理能力。与依赖于内部推理的常规基于LLM的推理方法不同,代理推理通过动态地利用网络搜索、代码执行和结构化推理背景记忆来解决需要深入研究和多步逻辑推理的复杂问题。我们的框架引入了Mind Map代理,该代理构建了一个结构化的知识图谱,以跟踪逻辑关系,提高演绎推理能力。此外,网络搜索和编程代理的集成能够实现实时检索和计算分析,增强推理准确性和决策能力。在博士层级的科学推理(GPQA)和特定领域的深度研究任务上的评估表明,我们的方法显著优于现有模型,包括领先的检索增强生成(RAG)系统和闭源LLM。此外,我们的结果表明,代理推理可以提高专家级知识综合、测验时的可扩展性和结构化问题解决能力。代码地址: https://github.com/theworldofagents/Agentic-Reasoning。