摘要
arXiv:2503.24377v1 Announce Type: cross
摘要:近期大规模语言模型(LLMs)的进步显著增强了其执行复杂推理任务的能力,从快速和直观的思考(System 1)转向缓慢而深入的推理(System 2)。虽然System 2推理提高了任务准确性,但由于其缓慢思考的特性及其低效或不必要的推理行为,往往会带来巨大的计算成本。相比之下,System 1推理计算效率高,但会导致次优性能。因此,平衡性能(收益)和计算成本(预算)之间的权衡至关重要,从而产生了推理经济的概念。在这篇综述中,我们提供了对LLMs在训练后和测试时推断阶段推理经济的全面分析,包括i)推理低效的原因,ii)不同推理模式的行为分析,以及iii)实现推理经济的潜在解决方案。通过提供可操作的见解并突出显示开放挑战,我们旨在阐明提高LLMs推理经济性的策略,从而成为推进该领域研究的宝贵资源。我们还提供了一个公共仓库,以持续跟踪这一快速发展的领域的发展。