LLM2D

摘要

arXiv:2502.04667v2 宣告类型: replace-cross 摘要：将显式的链式思考（CoT）推理纳入大型语言模型（LLMs）的训练中，已经增强了它们的推理能力，但CoT如何提升泛化能力的具体机制仍然不够理解。本文探讨了（1）**CoT训练如何重塑内部模型表示**以及（2）**为什么它能够同时改善分布内（ID）和分布外（OOD）推理的泛化能力**。通过受控实验和理论分析，我们得出以下关键洞察。 **1)** 结构优势：CoT训练将推理内化为一个两阶段的泛化电路，其中阶段的数量对应于训练期间的明确推理步骤。值得注意的是，与非CoT同侪相比，CoT训练的模型在较浅的层中求解中间结果，从而使较深的层专门化于后续的推理步骤。**2)** 理论分析：通过分布差异的信息论泛化界限可以分解为ID和OOD两部分。尽管针对充足训练，ID错误无论是否有CoT都会减少，但OOD错误严重依赖于CoT：非CoT训练由于无法识别未见过的推理模式而无法泛化到OOD样本，而CoT训练通过在训练过程中掌握子任务和推理组合，实现了接近完美的OOD泛化。所识别的机制解释了我们的实验结果：CoT训练加速了收敛，并增强了从ID到ID和OOD场景的泛化，即使在可容忍的噪声下也能保持稳健性能。这些发现也在复杂的现实世界数据集上得到了进一步验证。本文为设计增强LLM推理稳健性的CoT策略提供了宝贵的见解。