LLM2D

摘要

arXiv:2502.10428v4 宣告类型: 替换摘要: 为了降低由计算冗余和延迟奖励分配在长CoT过程中引起的计算资源成本和消耗，本研究提出了具有自适应推理时间和步骤的动态链式思考(D-CoT)。研究人员通过使用Python 3.13 IDLE结合基于GPTs的Python仿真器来模拟D-CoT的集成。同时，研究人员使用DeepSeek R1作为对照组，测试并比较了D-CoT仿真器在处理MIT OpenCourseWare线性代数考试问题时的性能。实验结果表明，与基于长时间CoT的DeepSeek R1相比，D-CoT在推理时间、CoT长度（推理步骤）和标记计数三个方面表现更优，实现了计算资源消耗的显著减少。此外，本研究在深度推理优化方面具有潜在价值，并可作为未来动态深度推理框架的参考。