摘要
arXiv:2502.12589v1 通知类型: 新颖
摘要: 最近,在训练语言模型进行逐步推理以解决复杂的数值推理任务方面取得了显著进展。除了用于解决这些问题的方法之外,问题本身的结构和表述方式也在决定大型语言模型的性能中起着重要作用。我们观察到,即使数学问题的表面形式发生一些小变化,也可能会对答案分布和解决率产生深远影响。这凸显了LLMs对表面级变化的脆弱性,揭示了其在处理复杂问题时的有限鲁棒性。在本文中,我们提出了一种RM-PoT三阶段框架,该框架结合了问题重述(RM)、代码辅助推理(PoT)和领域感知的少样本学习,以解决这些限制。我们的方法首先将输入问题转化为多种表面形式,以减少结构偏向,然后从前构建的领域特定问题库中检索五个语义对齐的示例,以提供上下文指导,并最后生成可执行的Python代码以进行精确计算。