LLM2D

摘要

核心ference解析（CR）模型的泛化能力有限一直是该任务广泛应用的主要瓶颈。先前的工作已经确定了标注差异，特别是对于提及检测，是造成泛化差距的主要原因之一，并建议使用额外的标注目标领域数据。我们提出了一种替代的参照任务，即主要实体识别（MEI），而不是依赖于这种额外的标注，我们：(a) 假设目标实体在输入中指定，以及 (b) 将任务限制在只有频繁出现的实体。通过广泛的实验，我们证明了 MEI 模型在多个数据集上具有良好的跨域泛化能力，包括监督模型和基于 LLM 的少样本提示。此外，MEI 符合分类框架，这使得能够使用稳健且直观的基于分类的指标。最后，MEI 也很实用，因为它允许用户搜索特定实体或感兴趣的一组实体的所有提及。