LLM2D

摘要

arXiv:2503.24377v1 Announce Type: cross 摘要：近期大规模语言模型（LLMs）的进步显著增强了其执行复杂推理任务的能力，从快速和直观的思考（System 1）转向缓慢而深入的推理（System 2）。虽然System 2推理提高了任务准确性，但由于其缓慢思考的特性及其低效或不必要的推理行为，往往会带来巨大的计算成本。相比之下，System 1推理计算效率高，但会导致次优性能。因此，平衡性能（收益）和计算成本（预算）之间的权衡至关重要，从而产生了推理经济的概念。在这篇综述中，我们提供了对LLMs在训练后和测试时推断阶段推理经济的全面分析，包括i）推理低效的原因，ii）不同推理模式的行为分析，以及iii）实现推理经济的潜在解决方案。通过提供可操作的见解并突出显示开放挑战，我们旨在阐明提高LLMs推理经济性的策略，从而成为推进该领域研究的宝贵资源。我们还提供了一个公共仓库，以持续跟踪这一快速发展的领域的发展。