摘要
arXiv:2502.09307v1 声明类型:cross
摘要:现代大型语言模型(LLMs)在许多语言任务中展示了类似人类的能力,引发了对LLMs和人类语言处理能力的比较兴趣。在这篇论文中,我们使用花园路径构造进行了一个详细的比较任务,这是对人类来说历来非常具有挑战性的句子理解任务。基于语言心理学研究,我们提出了关于为什么花园路径句子难以处理的假设,并通过理解问题在人类参与者和大量LLMs上测试了这些假设。我们的发现揭示了LLMs和人类在特定句法复杂性上都遇到了困难,有些模型与人类理解高度相关。为了补充这些发现,我们使用改写和文本到图像生成任务测试了LLMs对花园路径构造的理解,并发现结果与句子理解问题的结果相似,进一步验证了我们对这些构造的理解发现。