LLM2D

摘要

arXiv:2504.09100v1 表型类型: 新颖摘要: 最近，大型推理模型（LRMs），如DeepSeek-R1，通过缓慢的思考过程在推理能力方面取得了显著进展。尽管取得了这些成就，LRMs 的巨大计算需求仍然带来了很多挑战。相比之下，小型推理模型（SRMs），往往是从较大的模型中提炼出来的，提供了更高的效率，并且在推理能力和认知轨迹上与LRMs表现出不同的特征。本论文调查了约170篇最近发表的关于SRMs的研究论文，旨在解决各种复杂的推理任务。我们回顾了SRMs的当前研究状况，并分析了与SRMs相关的各种训练和推理技术。此外，我们还对SRMs在特定领域的应用进行了全面回顾，并讨论了未来研究方向的可能性。本调查为研究人员提供了一个重要的参考，以便利用或开发具有高效推理功能的SRMs。