LLM2D

摘要

arXiv:2503.18751v1 Announce Type: cross 摘要：构式语法假定语言的知识主要由构式（包括词汇、通用的语法规则，甚至独特的模式）的形式-意义对组成。近期的研究表明，变换器语言模型至少能够表示某些构式的模式，包括整体上较为罕见的构式模式。在本文中，我们探索了BERT对于英语中一个次要构式，即NPN（名词-介词-名词）构式的形式和意义的表示——例如，在“面对面”和“日复一日”这类表达中展现出来的，并且是多义的。我们构建了一个语义标注语料库（包括表面上看起来类似于该构式的干扰项）。利用这个数据集，我们训练并评估了一些探查分类器。它们能够较好地区分该构式和干扰项，以及对实际的该构式实例进行多义性消歧，并揭示了BERT嵌入中包含了该构式的语义暗示。此外，人为地改变实际构式实例的词序会导致它们被拒绝，这表明了对形式问题的敏感性。我们得出结论，BERT至少在一定程度上隐含编码了超越表面句法模式和词素线索的NPN构式的某些知识。