LLM2D
使用 BERT 进行构造识别与去歧义:NPN 的一个案例研究
Construction Identification and Disambiguation Using BERT: A Case Study of NPN
作者: Wesley Scivetti, Nathan Schneider
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2503.18751v1

摘要

arXiv:2503.18751v1 Announce Type: cross 摘要:构式语法假定语言的知识主要由构式(包括词汇、通用的语法规则,甚至独特的模式)的形式-意义对组成。近期的研究表明,变换器语言模型至少能够表示某些构式的模式,包括整体上较为罕见的构式模式。在本文中,我们探索了BERT对于英语中一个次要构式,即NPN(名词-介词-名词)构式的形式和意义的表示——例如,在“面对面”和“日复一日”这类表达中展现出来的,并且是多义的。我们构建了一个语义标注语料库(包括表面上看起来类似于该构式的干扰项)。利用这个数据集,我们训练并评估了一些探查分类器。它们能够较好地区分该构式和干扰项,以及对实际的该构式实例进行多义性消歧,并揭示了BERT嵌入中包含了该构式的语义暗示。此外,人为地改变实际构式实例的词序会导致它们被拒绝,这表明了对形式问题的敏感性。我们得出结论,BERT至少在一定程度上隐含编码了超越表面句法模式和词素线索的NPN构式的某些知识。