LLM2D

摘要

arXiv:2502.14791v1 交叉公告类型：cross 摘要：人类可以迅速从几个示例中学会新词，并且能够系统灵活地在新的语言环境中使用这些新词。然而，当前用于少量样本词汇学习的语言模型的能力及其改进方法尚未得到充分探索。在本研究中，我们提出了一种新的方法，即基于上下文学习词汇的元训练方法（Minnow）。这种方法通过使用一个特殊的占位符标记来表示新词，训练语言模型根据少量的上下文示例生成新词的使用示例。这种训练被应用于许多新词以培养一种通用的词汇学习能力。我们发现，通过Minnow从零开始对适用于儿童的语言进行训练，使得模型在少量样本词汇学习方面表现出强大的能力，与更大规模数据预训练的语言模型（LLM）具有可比性。此外，通过辨别性和生成性评估，我们表明使用Minnow对预训练的大语言模型进行微调能够提高它们区分新词、识别新词的句法类别，并基于一个或几个上下文示例生成合理的新词使用示例和定义的能力。这些发现突显了Minnow的数据效率及其在词汇学习任务中提高语言模型性能的潜力。