LLM2D

摘要

arXiv:2502.11684v1 交叉公告类型：cross 摘要：数学推理是推动大型语言模型（LLMs）发展的关键前沿领域。尽管逐步方法已成为LLMs中数学问题解决的主要范式，但训练数据中推理步骤的质量从根本上限制了模型的表现。最近的研究表明，更详细的中间步骤可以提高模型性能，然而现有的步骤扩展方法要么需要更强大的外部模型，要么会带来巨大的计算成本。在本文中，我们引入了MathFimer，一种以代码补全任务中的“填空”任务为灵感的数学推理步骤扩展新框架。通过将解决方案链分解为前缀-后缀对，并训练模型重构缺失的中间步骤，我们使用精心挑选的NuminaMath-FIM数据集开发了一个专门的模型MathFimer-7B。然后，我们将这些模型应用到现有的数学推理数据集中，通过将详细的中间步骤插入到解决方案链中，创建了MathFimer扩展版本。通过在包括MathInstruct、MetaMathQA等多个数学推理数据集上的全面实验，我们证明了基于MathFimer扩展数据训练的模型在各种基准测试，如GSM8K和MATH中，始终优于基于原始数据训练的模型。我们的方法提供了一种实用且可扩展的解决方案，可在不依赖于强大外部模型或昂贵的推断程序的情况下增强LLMs的数学推理能力。