摘要
arXiv:2502.07286v1 交叉类型: NER
摘要: 命名实体识别(NER)是自然语言处理(NLP)中的一个基本问题。然而,从扩展文本(例如主页)中提取较长实体跨度(例如奖项)的任务几乎尚未得到探索。当前的NER方法主要分为两类:基于跨度的方法和基于生成的方法。基于跨度的方法要求枚举所有可能的令牌对跨度,随后对每个跨度进行分类,这会导致大量的冗余计算和过高的GPU内存使用。相比之下,基于生成的方法涉及对大型语言模型(LLMs)进行提示或微调,以适应下游NER任务。然而,这些方法在准确生成较长跨度方面存在困难,并且在有效的微调过程中往往会产生显著的时间成本。为了解决这些挑战,本文介绍了一种轻量级的基于跨度的NER方法,称为SeNER,它结合了双向箭头注意机制以及对[CLS]标记的LogN-Scaling嵌入长文本,其中包括一种新颖的双向滑动窗口菱形注意机(BiSPA)机制,以显著减少冗余候选令牌对跨度,并同时建模令牌对跨度之间的交互。广泛的实验结果显示,我们的方法在三个长NER数据集上达到了最先进的提取准确率,并且能够以GPU内存友好方式从长文本中提取实体。代码:https://github.com/THUDM/scholar-profiling/tree/main/sener