LLM2D

摘要

随着大型语言模型（LLM）的不断发展，它们展现组合泛化能力的能力——即以训练期间未曾遇到的新颖方式组合学习到的技能的能力——引起了广泛关注。这种类型的泛化，特别是在超出训练数据的场景中，在人工智能安全和对齐的研究中也备受关注。最近的一项研究引入了SKILL-MIX评估，其中模型的任务是撰写一段简短的文字，以展示使用指定$k$元组语言技能的方式。虽然小型模型在$k=3$时难以进行组合，但GPT-4等大型模型在$k=5$和$k=6$时表现良好。本文使用类似于SKILL-MIX的设置，评估小型模型从示例中学习组合泛化能力。利用一组多样化的语言技能——包括修辞、文学、推理、心智理论和常识——GPT-4被用来生成展示随机$k$子集技能的文本样本。随后，在这些组合技能文本上对70亿和130亿参数模型进行微调，以提高$k$的值，揭示了以下发现：（1）在$k=2$和$k=3$技能组合上进行训练，可以显著提高撰写$k=4$和$k=5$技能文本的能力，尽管模型在训练期间从未见过此类示例。（2）当技能类别被分成训练组和保留组时，模型在测试期间显著提高了撰写包含保留技能的文本的能力，尽管它们在微调期间只看到了训练技能，这说明了即使对于以前从未见过的技能，这种训练方法也具有有效性。这项研究还表明，将富含技能（可能是合成的）文本纳入训练可以显著提高模型的组合能力。