LLM2D

摘要

arXiv:2502.06004v1 Announce Type: 不交叉摘要：标准英语（AAE）在自然语言处理（NLP）中提出了独特的挑战。这项研究系统地比较了可用的NLP模型——基于规则的模型、基于变压器的模型和大型语言模型（LLMs）——在识别AAE的关键语法特征方面的能力，特别是惯用语态和多重否定。这些特征因其独特的语法复杂性和出现频率而被选中。评估涉及句子级别的二分类任务，使用了零样本和少量样本两种策略。分析结果显示，虽然LLMs相比于基准模型显示出潜力，但它们受文本中最近和不相关的特征（如形式化）的影响。这项研究强调了改进模型训练和架构调整的必要性，以更好地适应AAE的独特语言特征。数据和代码可供获取。