LLM2D
语言模型在很大程度上表现出类似人类的成分排列偏好
Language Models Largely Exhibit Human-like Constituent Ordering Preferences
作者: Ada Defne Tur, Gaurav Kamath, Siva Reddy
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05670v1

摘要

arXiv:2502.05670v1 类型: cross 摘要:尽管英文句子在词序方面通常具有灵活性有限的特点,但语素的词序变化却表现出极大的多样性。一种重要的理论认为,语素的词序与其权重直接相关,权重可以通过语素的长度或复杂度来衡量。这种理论在自然语言处理(NLP)的背景下引起了人们的兴趣,因为尽管最近NLP的进步使得大型语言模型(LLMs)取得了显著的性能提升,但仍有许多关于这些模型如何处理语言的问题尚未清晰,以及这种处理方式如何与人类语言处理方式相比较。特别是,一个悬而未决的问题是LLMs是否表现出相同的构成移动模式,并可能为已有的关于构成移动转变何时以及如何在人类语言中发生理论提供见解。我们比较了具有不同特性的多种LLMs,评估了它们在四种构成移动类型上的广泛表现:重NP移动、助词移动、与给与交替和多个Pp。尽管在助词移动方面表现意外,但LLMs在构成顺序方面一般符合人类的偏好。