摘要
arXiv:2404.14963v5 通告类型: replace-cross
摘要:链式思考(CoT)提示在各种推理任务中增强了大型语言模型(LLMs)的表现。然而,CoT 在处理复杂的数学文字问题时仍存在不足,通常会遭受三种缺陷:语义理解错误、计算错误和步骤缺失错误。此前的研究主要解决了计算错误和步骤缺失错误,但忽略了语义理解错误,这是限制LLMs推理性能的主要因素。为此,我们提出了一种简单而有效的方法,即深层理解问题(DUP),通过解决语义理解错误来提高LLMs的数学问题解决能力。我们方法的核心是促使LLMs深入理解问题并提取用于更好推理的关键问题解决信息。在10个不同的推理基准上的广泛实验表明,我们的DUP方法在所有对照组中都表现出显著的优越性。更令人鼓舞的是,DUP在GSM8K基准上取得了新的SOTA结果,在零样本设置下准确率达到97.1%。