LLM2D

从系统1到系统2：大规模语言模型推理综述

From System 1 to System 2: A Survey of Reasoning Large Language Models

作者: Zhong-Zhi Li, Duzhen Zhang, Ming-Liang Zhang, Jiaxin Zhang, Zengyan Liu, Yuxuan Yao, Haotian Xu, Junhao Zheng, Pei-Jie Wang, Xiuyi Chen, Yingying Zhang, Fei Yin, Jiahua Dong, Zhiwei Li, Bao-Long Bi, Ling-Rui Mei, Junfeng Fang, Zhijiang Guo, Le Song, Cheng-Lin Liu

发布日期: 4/28/2025

arXiv ID: oai:arXiv.org:2502.17419v3

摘要

arXiv:2502.17419v3 公告类型: 替换摘要: 实现人类水平的智能需要从快速的直觉系统1向更慢的、更具斟酌性的系统2推理过渡。尽管系统1在快速、启发式的决策方面表现出色，系统2则依赖于逻辑推理以获得更准确的判断并减少偏见。基础大语言模型（LLMs）在快速决策方面表现出色，但缺乏进行复杂推理的深度，因为在系统2思考特有的逐步分析方面它们尚未充分采用。最近，如OpenAI的o1/o3和DeepSeek的R1等推理LLMs在数学和编程等领域的表现达到了专家级别的水平，紧密地模仿了系统2的审慎推理方式，并展示出了类似人类的认知能力。本文综述从基础LLMs的进步和早期系统2技术的发展开始，探讨了它们结合的方式如何为推理LLMs铺平道路。接下来，我们讨论了如何构建推理LLMs，分析了它们的特征、实现高级推理的核心方法以及各种推理LLMs的演变。此外，我们概述了推理基准，提供了代表性推理LLMs性能的深入比较。最后，我们探讨了推进推理LLMs的有希望方向，并保持了一个实时的\href{https://github.com/zzli2022/Awesome-Slow-Reason-System}{GitHub Repository}以追踪最新发展。我们希望这篇综述能成为有价值的资源，激发创新并推动这一快速演变领域的发展。

查看原文下载 PDF