摘要
arXiv:2502.05078v1 宣告类型: 新
摘要: 大型语言模型(LLMs)展示了令人印象深刻的推理能力,但它们的表现高度依赖于提示策略和模型规模。尽管强化学习和微调已被部署以增强推理,但这些方法会带来巨大的计算和数据开销。在本工作中,我们提出了适应性思想图(AGoT),这是一种动态的、基于图的推理框架,仅在测试时增强LLM的推理能力。AGoT 不依赖于固定步长的方法(如思维链(CoT)或思维树(ToT)),而是递归地将复杂查询分解为结构化的子问题,形成一个动态的有向无环图(DAG),包括相互依赖的推理步骤。通过仅扩展那些需要进一步分析的子问题,AGoT 统一了链式、树状和图状范式的优点,形成一个协调的框架,将计算资源集中使用在最需要的地方。我们在涵盖多跳检索、科学推理和数学问题解决等多样基准上进行了验证,科学推理任务(GPQA)的最佳表现提高了46.2%,这与通过密集计算的强化学习方法获得的收益相当,并优于最先进的迭代方法。这些结果表明,动态分解和结构化递归提供了一种可扩展且成本效益高的替代方案,即后训练修改的替代方案,为LLMs提供了更稳健和通用的推理。