LLM2D
动态链式思考:迈向适应性深度推理
Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning
作者: Libo Wang
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2502.10428v4

摘要

arXiv:2502.10428v4 宣告类型: 替换 摘要: 为了降低由计算冗余和延迟奖励分配在长CoT过程中引起的计算资源成本和消耗,本研究提出了具有自适应推理时间和步骤的动态链式思考(D-CoT)。研究人员通过使用Python 3.13 IDLE结合基于GPTs的Python仿真器来模拟D-CoT的集成。同时,研究人员使用DeepSeek R1作为对照组,测试并比较了D-CoT仿真器在处理MIT OpenCourseWare线性代数考试问题时的性能。实验结果表明,与基于长时间CoT的DeepSeek R1相比,D-CoT在推理时间、CoT长度(推理步骤)和标记计数三个方面表现更优,实现了计算资源消耗的显著减少。此外,本研究在深度推理优化方面具有潜在价值,并可作为未来动态深度推理框架的参考。