LLM2D

摘要

arXiv:2502.09307v1 声明类型：cross 摘要：现代大型语言模型（LLMs）在许多语言任务中展示了类似人类的能力，引发了对LLMs和人类语言处理能力的比较兴趣。在这篇论文中，我们使用花园路径构造进行了一个详细的比较任务，这是对人类来说历来非常具有挑战性的句子理解任务。基于语言心理学研究，我们提出了关于为什么花园路径句子难以处理的假设，并通过理解问题在人类参与者和大量LLMs上测试了这些假设。我们的发现揭示了LLMs和人类在特定句法复杂性上都遇到了困难，有些模型与人类理解高度相关。为了补充这些发现，我们使用改写和文本到图像生成任务测试了LLMs对花园路径构造的理解，并发现结果与句子理解问题的结果相似，进一步验证了我们对这些构造的理解发现。