LLM2D

摘要

本研究提出了一种新颖的学习方法，旨在增强大型语言模型 (LLM) 的数学推理和问题解决能力。我们专注于整合思维链 (CoT) 和思维程序 (PoT) 学习，假设优先学习数学推理能力有助于增强问题解决能力。因此，使用 CoT 进行的初始学习对于解决具有挑战性的数学问题至关重要。为此，我们提出了一种名为 SAAS（解决能力放大策略）的顺序学习方法，该方法战略性地从 CoT 学习过渡到 PoT 学习。我们使用多个基准进行的广泛性能比较的实证研究表明，我们的 SAAS 实现了最先进 (SOTA) 的性能。结果强调了我们的顺序学习方法的有效性，标志着 LLM 数学推理领域的一项重大进步。