摘要
arXiv:2502.10428v4 宣告类型: 替换
摘要: 为了降低由计算冗余和延迟奖励分配在长CoT过程中引起的计算资源成本和消耗,本研究提出了具有自适应推理时间和步骤的动态链式思考(D-CoT)。研究人员通过使用Python 3.13 IDLE结合基于GPTs的Python仿真器来模拟D-CoT的集成。同时,研究人员使用DeepSeek R1作为对照组,测试并比较了D-CoT仿真器在处理MIT OpenCourseWare线性代数考试问题时的性能。实验结果表明,与基于长时间CoT的DeepSeek R1相比,D-CoT在推理时间、CoT长度(推理步骤)和标记计数三个方面表现更优,实现了计算资源消耗的显著减少。此外,本研究在深度推理优化方面具有潜在价值,并可作为未来动态深度推理框架的参考。