LLM2D

摘要

arXiv:2410.02465v2 宣告类型：替换-交叉摘要：指令调优——使用指令-响应对进行监督微调——是使预训练的大语言模型（LLMs）具有可指令性的关键步骤。同时，LLMs 在预训练阶段进行多任务学习，获取了广泛的知识和能力。我们假设预训练阶段可以使它们具备理解并应对指令的能力。为了验证这一点，我们提出了响应调优（RT），它从指令调优的过程中去除了指令及其对应的响应映射，而是专注于建立响应分布。我们的实验表明，仅在响应上进行训练的 RT 模型能够有效地应对各种指令，并展现出接近其指令调优版本的帮助性。此外，我们观察到，在学习了训练响应中的拒绝条件后，模型能够识别并拒绝不安全的查询。进一步地，我们展示了这些观察结果也适用于上下文学习环境中。这些发现支持了我们的假设，突显了预训练 LLMs 的广泛内在能力。