LLM2D
利用推理经济:大型语言模型高效推理综述
Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models
作者: Rui Wang, Hongru Wang, Boyang Xue, Jianhui Pang, Shudong Liu, Yi Chen, Jiahao Qiu, Derek Fai Wong, Heng Ji, Kam-Fai Wong
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.24377v1

摘要

arXiv:2503.24377v1 Announce Type: cross 摘要:近期大规模语言模型(LLMs)的进步显著增强了其执行复杂推理任务的能力,从快速和直观的思考(System 1)转向缓慢而深入的推理(System 2)。虽然System 2推理提高了任务准确性,但由于其缓慢思考的特性及其低效或不必要的推理行为,往往会带来巨大的计算成本。相比之下,System 1推理计算效率高,但会导致次优性能。因此,平衡性能(收益)和计算成本(预算)之间的权衡至关重要,从而产生了推理经济的概念。在这篇综述中,我们提供了对LLMs在训练后和测试时推断阶段推理经济的全面分析,包括i)推理低效的原因,ii)不同推理模式的行为分析,以及iii)实现推理经济的潜在解决方案。通过提供可操作的见解并突出显示开放挑战,我们旨在阐明提高LLMs推理经济性的策略,从而成为推进该领域研究的宝贵资源。我们还提供了一个公共仓库,以持续跟踪这一快速发展的领域的发展。