摘要
核心ference解析(CR)模型的泛化能力有限一直是该任务广泛应用的主要瓶颈。先前的工作已经确定了标注差异,特别是对于提及检测,是造成泛化差距的主要原因之一,并建议使用额外的标注目标领域数据。我们提出了一种替代的参照任务,即主要实体识别(MEI),而不是依赖于这种额外的标注,我们:(a) 假设目标实体在输入中指定,以及 (b) 将任务限制在只有频繁出现的实体。通过广泛的实验,我们证明了 MEI 模型在多个数据集上具有良好的跨域泛化能力,包括监督模型和基于 LLM 的少样本提示。此外,MEI 符合分类框架,这使得能够使用稳健且直观的基于分类的指标。最后,MEI 也很实用,因为它允许用户搜索特定实体或感兴趣的一组实体的所有提及。