LLM2D

摘要

本文研究大型语言模型学习特定数学规则（如分配律或化简方程）的能力。我们对它们泛化这些规则以及在文字题中重用这些规则的能力进行了实证分析。为此，我们提供了一种严格的方法来构建包含此类规则的合成数据，并在这种数据上对大型语言模型进行微调。我们的实验表明，我们的模型可以在一定程度上学习和泛化这些规则，并适当地在文字题的背景下重用它们。