LLM2D
小型推理模型简要综述:训练、推理、应用与研究方向
A Short Survey on Small Reasoning Models: Training, Inference, Applications and Research Directions
作者: Chengyu Wang, Taolin Zhang, Richang Hong, Jun Huang
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.09100v1

摘要

arXiv:2504.09100v1 表型类型: 新颖 摘要: 最近,大型推理模型(LRMs),如DeepSeek-R1,通过缓慢的思考过程在推理能力方面取得了显著进展。尽管取得了这些成就,LRMs 的巨大计算需求仍然带来了很多挑战。相比之下,小型推理模型(SRMs),往往是从较大的模型中提炼出来的,提供了更高的效率,并且在推理能力和认知轨迹上与LRMs表现出不同的特征。本论文调查了约170篇最近发表的关于SRMs的研究论文,旨在解决各种复杂的推理任务。我们回顾了SRMs的当前研究状况,并分析了与SRMs相关的各种训练和推理技术。此外,我们还对SRMs在特定领域的应用进行了全面回顾,并讨论了未来研究方向的可能性。本调查为研究人员提供了一个重要的参考,以便利用或开发具有高效推理功能的SRMs。