LLM2D

摘要

大型语言模型（LLM）在众多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）方面，现有的基于LLM的方法表现不如基线方法，并且需要显著更多的计算资源，限制了它们的应用。本文介绍了基于生成提取和上下文分类（GEIC）的任务，旨在利用LLM的先验知识和自注意力机制来完成NER任务。然后，我们提出了CascadeNER，这是一个通用的多语言GEIC框架，用于少样本和零样本NER。CascadeNER采用模型级联，利用两个参数较小的LLM独立地进行提取和分类，从而降低资源消耗，同时提高准确率。我们还介绍了AnythingNER，这是第一个专门为LLM设计的NER数据集，包括8种语言、155种实体类型和一个新颖的动态分类系统。实验表明，CascadeNER在低资源和细粒度场景（包括CrossNER和FewNERD）中取得了最先进的性能。我们的工作是公开可访问的。