LLM2D
模型可以也应该拥抱人类生成数学的交流性质
Models Can and Should Embrace the Communicative Nature of Human-Generated Math
作者: Sasha Boguraev, Ben Lipkin, Leonie Weissweiler, Kyle Mahowald
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.17005v1

摘要

数学是由人为了人而创造的:正如自然语言语料库不仅反映命题,还反映语言使用者的交流目标一样,模型训练所使用的数学数据不仅反映了理想化的数学实体,还反映了丰富的交流意图。虽然以纯粹符号的方式处理数学有其重要优势,但我们在此假设,将数学视为情境化的语言交流是有益的,而语言模型非常适合实现这一目标,其方式尚未得到充分认识。我们用两个案例研究说明了这些观点。首先,我们进行了一项实验,发现语言模型以类人的方式解释等号——为相同的基础方程的不同排列方式生成系统不同的文字问题。其次,我们发现语言模型更喜欢以自然的方式排列证明,即使其他顺序在逻辑上是等价的。我们主张开发从人类生成的数学中学习并代表其中隐含的交流意图的 AI 系统。