LLM2D

摘要

arXiv:2502.02391v1 声明类型：交叉摘要：我们引入了FewTopNER，这是一种新颖的框架，将少量样本命名实体识别（NER）与主题感知上下文建模相结合，以应对跨语言和低资源场景中的挑战。FewTopNER 利用基于 XLM-RoBERTa 的共享多语言编码器，并通过语言特定的校准机制加以增强，生成稳健的上下文嵌入。该架构包括一个基于原型的实体识别分支，采用双向 LSTM 和条件随机场进行序列标注，以及一个通过混合概率和神经方法提取文档级语义特征的主题建模分支。跨任务桥梁实现了实体和主题表示之间的动态双向注意和特征融合，从而通过引入全局语义上下文来增强实体消歧。在英语、法语、西班牙语、德语和意大利语的多语言基准上的实证评估表明，FewTopNER 显著优于现有最先进的少量样本 NER 模型。特别是在 F1分数上，该框架实现了2.5-4.0个百分点的改进，并通过归一化点互信息度量显示出增强的主题一致性。消融研究进一步证实了共享编码器和跨任务集成机制对总体性能的贡献。这些结果强调了将主题感知上下文整合到少量样本 NER 中的有效性，并突显了FewTopNER在低资源条件下实现稳健跨语言应用的潜力。