摘要
本研究提出了一种新颖的学习方法,旨在增强大型语言模型 (LLM) 的数学推理和问题解决能力。我们专注于整合思维链 (CoT) 和思维程序 (PoT) 学习,假设优先学习数学推理能力有助于增强问题解决能力。因此,使用 CoT 进行的初始学习对于解决具有挑战性的数学问题至关重要。为此,我们提出了一种名为 SAAS(解决能力放大策略)的顺序学习方法,该方法战略性地从 CoT 学习过渡到 PoT 学习。我们使用多个基准进行的广泛性能比较的实证研究表明,我们的 SAAS 实现了最先进 (SOTA) 的性能。结果强调了我们的顺序学习方法的有效性,标志着 LLM 数学推理领域的一项重大进步。