LLM2D

摘要

大型语言模型（LLMs）在数学和算法任务中展现出日益增强的能力，然而它们在几何推理方面的技能却鲜有探索。我们研究了LLMs在构建性几何问题解决中的能力，这是人类数学推理发展中最基本的步骤之一。我们的工作揭示了最先进的LLMs在这一领域面临的显著挑战，尽管它们在类似领域取得了许多成功。LLMs在目标变量选择上表现出偏见，并且在处理二维空间关系时遇到困难，常常错误地表示和幻觉对象及其位置。为此，我们引入了一个框架，该框架构建了一个基于LLMs的多代理系统，通过内部对话增强其现有的推理潜力。这项工作强调了LLMs在几何推理方面的当前局限性，并通过自我纠正、协作和多样化角色专业化来提升几何推理能力。