LLM2D
指令嵌入:面向任务识别的潜在指令表征
Instruction Embedding: Latent Representations of Instructions Towards Task Identification
作者: Yiwei Li, Jiayi Shi, Shaoxiong Feng, Peiwen Yuan, Xinglin Wang, Boyuan Pan, Heda Wang, Yao Hu, Kan Li
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19680v1

摘要

指令数据对于提升大型语言模型(LLMs)的能力至关重要,使其能够与人类水平的表现相一致。最近的研究 LIMA 表明,对齐本质上是一个过程,模型通过利用预训练的知识和技能,适应指令的交互风格或格式来解决各种任务。因此,对于指令数据而言,最重要的方面是它所代表的任务,而不是特定的语义和知识信息。指令的潜在表示在某些与指令相关的任务中发挥作用,例如数据选择和演示检索。然而,它们始终源于文本嵌入,包含影响任务类别表示的整体语义信息。在这项工作中,我们引入了一个新的概念,指令嵌入,并构建了指令嵌入基准(IEB)用于其训练和评估。然后,我们提出了一种基于提示的指令嵌入(PIE)方法,使表示更关注任务。在 IEB 上使用两个设计的任务对 PIE 与其他嵌入方法进行评估,结果表明它在准确识别任务类别方面具有优越的性能。此外,指令嵌入在四个下游任务中的应用展示了其有效性和对与指令相关任务的适用性。