LLM2D
CoT-ICL 实验室:一种研究基于上下文示范的思考链学习的培养皿
CoT-ICL Lab: A Petri Dish for Studying Chain-of-Thought Learning from In-Context Demonstrations
作者: Vignesh Kothapalli, Hamed Firooz, Maziar Sanjabi
发布日期: 2/24/2025
arXiv ID: oai:arXiv.org:2502.15132v1

摘要

arXiv:2502.15132v1 声明类型:cross 摘要:我们引入了CoT-ICL Lab,这是一种框架和方法论,用于生成合成标记数据集,并系统地研究语言模型中的链式思维(CoT)内省学习(ICL)。CoT-ICL Lab通过解耦(1)链式令牌生成中涉及的因果结构与(2)底层令牌处理函数,实现了对内省示例复杂性的细粒度控制。我们使用这些数据集训练仅解码器变换器(最多700M参数),并展示了随着模型规模的增大,CoT能够加速准确性提升。特别是,我们发现对于有限的内省示例,模型深度对于利用CoT至关重要,而更多的示例可以使浅层模型达到深层模型的性能。此外,在训练过程中限制令牌处理函数的多样性可以提高通过ICL的学习因果结构。我们还通过分析变换器嵌入和注意图解释了这些转变。总体而言,CoT-ICL Lab为语言模型中的ICL和CoT的理论和实证洞察提供了一个简单而强大的实验平台。