LLM2D

摘要

arXiv:2404.14963v5 通告类型: replace-cross 摘要：链式思考（CoT）提示在各种推理任务中增强了大型语言模型（LLMs）的表现。然而，CoT 在处理复杂的数学文字问题时仍存在不足，通常会遭受三种缺陷：语义理解错误、计算错误和步骤缺失错误。此前的研究主要解决了计算错误和步骤缺失错误，但忽略了语义理解错误，这是限制LLMs推理性能的主要因素。为此，我们提出了一种简单而有效的方法，即深层理解问题（DUP），通过解决语义理解错误来提高LLMs的数学问题解决能力。我们方法的核心是促使LLMs深入理解问题并提取用于更好推理的关键问题解决信息。在10个不同的推理基准上的广泛实验表明，我们的DUP方法在所有对照组中都表现出显著的优越性。更令人鼓舞的是，DUP在GSM8K基准上取得了新的SOTA结果，在零样本设置下准确率达到97.1%。