LLM2D
模型能够从示例中学习技能组合吗?
Can Models Learn Skill Composition from Examples?
作者: Haoyu Zhao, Simran Kaur, Dingli Yu, Anirudh Goyal, Sanjeev Arora
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19808v1

摘要

随着大型语言模型(LLM)的不断发展,它们展现组合泛化能力的能力——即以训练期间未曾遇到的新颖方式组合学习到的技能的能力——引起了广泛关注。这种类型的泛化,特别是在超出训练数据的场景中,在人工智能安全和对齐的研究中也备受关注。最近的一项研究引入了SKILL-MIX评估,其中模型的任务是撰写一段简短的文字,以展示使用指定$k$元组语言技能的方式。虽然小型模型在$k=3$时难以进行组合,但GPT-4等大型模型在$k=5$和$k=6$时表现良好。 本文使用类似于SKILL-MIX的设置,评估小型模型从示例中学习组合泛化能力。利用一组多样化的语言技能——包括修辞、文学、推理、心智理论和常识——GPT-4被用来生成展示随机$k$子集技能的文本样本。随后,在这些组合技能文本上对70亿和130亿参数模型进行微调,以提高$k$的值,揭示了以下发现:(1)在$k=2$和$k=3$技能组合上进行训练,可以显著提高撰写$k=4$和$k=5$技能文本的能力,尽管模型在训练期间从未见过此类示例。(2)当技能类别被分成训练组和保留组时,模型在测试期间显著提高了撰写包含保留技能的文本的能力,尽管它们在微调期间只看到了训练技能,这说明了即使对于以前从未见过的技能,这种训练方法也具有有效性。这项研究还表明,将富含技能(可能是合成的)文本纳入训练可以显著提高模型的组合能力。