摘要
arXiv:2502.06004v1 Announce Type: 不交叉
摘要:标准英语(AAE)在自然语言处理(NLP)中提出了独特的挑战。这项研究系统地比较了可用的NLP模型——基于规则的模型、基于变压器的模型和大型语言模型(LLMs)——在识别AAE的关键语法特征方面的能力,特别是惯用语态和多重否定。这些特征因其独特的语法复杂性和出现频率而被选中。评估涉及句子级别的二分类任务,使用了零样本和少量样本两种策略。分析结果显示,虽然LLMs相比于基准模型显示出潜力,但它们受文本中最近和不相关的特征(如形式化)的影响。这项研究强调了改进模型训练和架构调整的必要性,以更好地适应AAE的独特语言特征。数据和代码可供获取。