LLM2D

摘要

arXiv:2502.05078v1 宣告类型: 新摘要: 大型语言模型（LLMs）展示了令人印象深刻的推理能力，但它们的表现高度依赖于提示策略和模型规模。尽管强化学习和微调已被部署以增强推理，但这些方法会带来巨大的计算和数据开销。在本工作中，我们提出了适应性思想图（AGoT），这是一种动态的、基于图的推理框架，仅在测试时增强LLM的推理能力。AGoT 不依赖于固定步长的方法（如思维链（CoT）或思维树（ToT）），而是递归地将复杂查询分解为结构化的子问题，形成一个动态的有向无环图（DAG），包括相互依赖的推理步骤。通过仅扩展那些需要进一步分析的子问题，AGoT 统一了链式、树状和图状范式的优点，形成一个协调的框架，将计算资源集中使用在最需要的地方。我们在涵盖多跳检索、科学推理和数学问题解决等多样基准上进行了验证，科学推理任务（GPQA）的最佳表现提高了46.2%，这与通过密集计算的强化学习方法获得的收益相当，并优于最先进的迭代方法。这些结果表明，动态分解和结构化递归提供了一种可扩展且成本效益高的替代方案，即后训练修改的替代方案，为LLMs提供了更稳健和通用的推理。