LLM2D

摘要

arXiv:2502.09100v1 通知类型: 新摘要：随着 OpenAI o3 和 DeepSeek-R1 等先进推理模型的出现，大型语言模型（LLM）展现了非凡的推理能力。然而，它们进行严格逻辑推理的能力仍然是一个开放的问题。本文综述了 LLM 中逻辑推理的近期进展，这是人工智能研究的一个关键领域。本文概述了 LLM 中逻辑推理的范围、理论基础以及用于评估推理能力的标准。我们分析了不同推理范式（演绎、归纳、 abduction 和类比）下的现有能力，并评估了提高推理性能的策略，包括以数据为中心的调优、强化学习、解码策略和神经符号方法。本文以未来方向收尾，强调加强人工智能系统中逻辑推理的进一步探索的必要性。