摘要
arXiv:2504.09440v1 宣告类型: 新
摘要: 大型语言模型(LLMs)展示了强大的数学推理能力,但在定理证明、符号操作和数值计算等方面仍然容易产生幻觉,产生虽然合理但错误的陈述。虽然已经探索了自一致性(SC)作为提高LLMs事实准确性的方法,但现有方法主要将SC应用到最终答案的选择上,忽视了中间推理步骤的逻辑一致性。在这项工作中,我们引入了一个结构化的自一致性框架,旨在增强数学推理的可靠性。我们的方法在中间步骤和最终输出上强制执行自一致性,减少逻辑不一致性和幻觉。我们在三个核心数学任务上评估了我们的方法:定理证明、符号变换和数值计算。实验结果表明,SC显著提高了证明的有效性、符号推理的准确性以及数值稳定性,同时保持了计算效率。进一步的分析表明,结构化的自一致性不仅提高了问题解决的准确性,还减少了模型生成输出的变异性。这些发现突显了自一致性作为提高LLMs数学推理的稳健机制的作用,为进一步实现更可靠和可解释的AI驱动数学铺平了道路。