LLM2D
用于推理和规划的语言模型非近视生成
Language Model Non-myopic Generation for Reasoning and Planning
作者: Chang Ma, Haiteng Zhao, Junlei Zhang, Junxian He, Lingpeng Kong
发布日期: 10/23/2024
arXiv ID: oai:arXiv.org:2410.17195v1

摘要

大型语言模型在将复杂问题分解成一系列步骤方面展现了卓越的推理和规划能力。尽管它们在数学问题求解和编码等各个领域取得了成功,但由于其自回归解码固有的短视性,大型语言模型在确保可靠和最佳规划方面面临挑战。本文从最优控制的角度重新审视大型语言模型的推理,提出了一种新方法——预测解码,该方法利用模型预测控制来提高规划精度。通过基于前瞻轨迹重新加权大型语言模型的分布,预测解码旨在减轻早期错误并促进非短视规划。我们的实验表明,在数学、编码和智能体等各种任务中都有显著改进。此外,预测解码还展现出计算效率,在减少计算资源的情况下优于基于搜索的基线方法。这项研究为优化大型语言模型的规划能力提供了见解。