LLM2D

摘要

arXiv:2502.03843v1 宣告类型: cross 摘要：高质量的大规模指令对于对齐大型语言模型（LLMs）至关重要，然而，在自然语言理解（NLU）领域，指令的数量存在严重短缺。以前关于构建NLU指令的工作主要集中在信息提取（IE）上，忽略了机器阅读理解、问答和文本分类等任务。此外，数据的缺乏多样性导致了训练好的LLMs在其他NLU任务上的泛化能力下降，基本模型的整体能力也有了明显的下降。为了解决这一问题，我们提出Hum，一个用于NLU任务的大规模高质量合成指令语料库，旨在增强LLMs的NLU能力。具体而言，Hum包括IE（无论是接近的IE还是开放的IE）、机器阅读理解、文本分类和指令专家任务，从而丰富了任务的多样性。此外，我们引入了一种人类-LLMs协作机制来合成指令，通过引入指导原则、偏好规则和格式变体，进一步丰富了指令的多样性。我们在5个NLU任务和28个通用能力评估数据集上对LLMs进行了广泛的实验。实验结果表明，Hum平均提高了6个LLMs的NLU能力3.1%，而在其他通用能力方面没有观察到显著下降。