LLM2D
逐步 perplexity 引导细化以提高大型语言模型的高效链式推理
Stepwise Perplexity-Guided Refinement for Efficient Chain-of-Thought Reasoning in Large Language Models
作者: Yingqian Cui, Pengfei He, Jingying Zeng, Hui Liu, Xianfeng Tang, Zhenwei Dai, Yan Han, Chen Luo, Jing Huang, Zhen Li, Suhang Wang, Yue Xing, Jiliang Tang, Qi He
发布日期: 2/20/2025
arXiv ID: oai:arXiv.org:2502.13260v1

摘要

arXiv:2502.13260v1 交叉公告类型:交叉 摘要:链式推理(CoT,Chain-of-Thought)是一种将复杂任务分解为中间推理步骤的方法,显著增强了大型语言模型(LLMs)在挑战性任务上的性能。然而,CoT 中的详细推理过程常常会导致生成时间过长和计算成本过高,部分原因是包含了不必要的步骤。为了解决这一问题,我们提出了一种使用困惑度作为衡量其重要性的方法来识别关键推理步骤:如果移除某一步骤会导致困惑度显著增加,则该步骤被视作关键步骤。我们的方法使模型能够仅专注于生成这些关键步骤。这可以通过两种方法实现:在少样本链式推理中改进示范示例,或通过仅包含关键步骤的选定示例微调模型。全面的实验验证了我们方法的有效性,该方法在CoT的推理准确性和效率之间取得了更好的平衡。