LLM2D
Home
Arxiv
返回列表
基于大型语言模型学习数学规则
Learning Mathematical Rules with Large Language Models
作者:
Antoine Gorceix, Bastien Le Chenadec, Ahmad Rammal, Nelson Vadori, Manuela Veloso
发布日期:
10/23/2024
arXiv ID:
oai:arXiv.org:2410.16973v1
摘要
本文研究大型语言模型学习特定数学规则(如分配律或化简方程)的能力。我们对它们泛化这些规则以及在文字题中重用这些规则的能力进行了实证分析。为此,我们提供了一种严格的方法来构建包含此类规则的合成数据,并在这种数据上对大型语言模型进行微调。我们的实验表明,我们的模型可以在一定程度上学习和泛化这些规则,并适当地在文字题的背景下重用它们。
查看原文
下载 PDF