摘要
大型语言模型(LLMs)在数学和算法任务中展现出日益增强的能力,然而它们在几何推理方面的技能却鲜有探索。我们研究了LLMs在构建性几何问题解决中的能力,这是人类数学推理发展中最基本的步骤之一。我们的工作揭示了最先进的LLMs在这一领域面临的显著挑战,尽管它们在类似领域取得了许多成功。LLMs在目标变量选择上表现出偏见,并且在处理二维空间关系时遇到困难,常常错误地表示和幻觉对象及其位置。为此,我们引入了一个框架,该框架构建了一个基于LLMs的多代理系统,通过内部对话增强其现有的推理潜力。这项工作强调了LLMs在几何推理方面的当前局限性,并通过自我纠正、协作和多样化角色专业化来提升几何推理能力。