LLM2D

摘要

arXiv:2502.07286v1 交叉类型: NER 摘要: 命名实体识别（NER）是自然语言处理（NLP）中的一个基本问题。然而，从扩展文本（例如主页）中提取较长实体跨度（例如奖项）的任务几乎尚未得到探索。当前的NER方法主要分为两类：基于跨度的方法和基于生成的方法。基于跨度的方法要求枚举所有可能的令牌对跨度，随后对每个跨度进行分类，这会导致大量的冗余计算和过高的GPU内存使用。相比之下，基于生成的方法涉及对大型语言模型（LLMs）进行提示或微调，以适应下游NER任务。然而，这些方法在准确生成较长跨度方面存在困难，并且在有效的微调过程中往往会产生显著的时间成本。为了解决这些挑战，本文介绍了一种轻量级的基于跨度的NER方法，称为SeNER，它结合了双向箭头注意机制以及对[CLS]标记的LogN-Scaling嵌入长文本，其中包括一种新颖的双向滑动窗口菱形注意机（BiSPA）机制，以显著减少冗余候选令牌对跨度，并同时建模令牌对跨度之间的交互。广泛的实验结果显示，我们的方法在三个长NER数据集上达到了最先进的提取准确率，并且能够以GPU内存友好方式从长文本中提取实体。代码：https://github.com/THUDM/scholar-profiling/tree/main/sener