摘要
arXiv:2502.09100v1 通知类型: 新
摘要:随着 OpenAI o3 和 DeepSeek-R1 等先进推理模型的出现,大型语言模型(LLM)展现了非凡的推理能力。然而,它们进行严格逻辑推理的能力仍然是一个开放的问题。本文综述了 LLM 中逻辑推理的近期进展,这是人工智能研究的一个关键领域。本文概述了 LLM 中逻辑推理的范围、理论基础以及用于评估推理能力的标准。我们分析了不同推理范式(演绎、归纳、 abduction 和类比)下的现有能力,并评估了提高推理性能的策略,包括以数据为中心的调优、强化学习、解码策略和神经符号方法。本文以未来方向收尾,强调加强人工智能系统中逻辑推理的进一步探索的必要性。