LLM2D
少样本持续关系抽取中语言模型泛化能力的保持
Preserving Generalization of Language models in Few-shot Continual Relation Extraction
作者: Quyen Tran, Nguyen Xuan Thanh, Nguyen Hoang Anh, Nam Le Hai, Trung Le, Linh Van Ngo, Thien Huu Nguyen
发布日期: 10/2/2024
arXiv ID: oai:arXiv.org:2410.00334v1

摘要

少样本持续关系抽取 (FCRE) 是一种新兴且充满活力的研究领域,其中模型可以从有限的标注数据中顺序整合新关系的知识,同时规避灾难性遗忘并保留来自预训练主干网络的先验知识。在本研究中,我们提出了一种利用经常被丢弃的语言模型头的创新方法。通过利用这些组件,并采用互信息最大化策略,我们的方法有助于维护来自预训练主干网络的先验知识,并战略性地对齐主要分类头,从而提高模型性能。此外,我们探讨了大型语言模型 (LLMs) 在解决 FCRE 挑战方面的潜力,它们以其丰富的知识而闻名。我们全面的实验结果强调了所提出方法的有效性,并为未来工作提供了宝贵的见解。