摘要
大型语言模型(LLM)在众多自然语言处理任务中取代了传统方法。然而,在命名实体识别(NER)方面,现有的基于LLM的方法表现不如基线方法,并且需要显著更多的计算资源,限制了它们的应用。本文介绍了基于生成提取和上下文分类(GEIC)的任务,旨在利用LLM的先验知识和自注意力机制来完成NER任务。然后,我们提出了CascadeNER,这是一个通用的多语言GEIC框架,用于少样本和零样本NER。CascadeNER采用模型级联,利用两个参数较小的LLM独立地进行提取和分类,从而降低资源消耗,同时提高准确率。我们还介绍了AnythingNER,这是第一个专门为LLM设计的NER数据集,包括8种语言、155种实体类型和一个新颖的动态分类系统。实验表明,CascadeNER在低资源和细粒度场景(包括CrossNER和FewNERD)中取得了最先进的性能。我们的工作是公开可访问的。