LLM2D
多任务学习中主动梯度冲突缓解:一种稀疏训练视角
Proactive Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective
作者: Zhi Zhang, Jiayi Shen, Congfeng Cao, Gaole Dai, Shiji Zhou, Qizhe Zhang, Shanghang Zhang, Ekaterina Shutova
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.18615v1

摘要

大型语言模型(LLM)已取代众多自然语言处理任务中的传统方法。然而,在命名实体识别(NER)中,现有的基于LLM的方法……