LLM2D

摘要

arXiv:2502.03671v1 类型: cross 摘要：大型语言模型（LLMs）在各种自然语言处理（NLP）任务中取得了显著的成功，但其推理能力仍然是一个基本的挑战。尽管LLMs表现出令人印象深刻的流畅性和事实记忆能力，但在进行复杂的推理、逻辑推理、数学问题解决、常识推理和多步骤推理等方面，它们的表现往往未能达到人类的期望。本文综述了增强LLMs推理能力的新兴技术。我们将现有的方法归类为关键方法，包括提示策略（例如，步骤推理、自我一致性、思维树推理）、架构创新（例如，检索增强模型、模块化推理网络和神经-符号集成）以及学习范式（例如，针对推理特定数据集的微调、强化学习和自我监督的推理目标）。此外，我们探讨了用于评估LLMs推理能力的评估框架，并指出了开放挑战，如幻觉、鲁棒性和跨多种任务的推理泛化能力。通过综合最近的进展，本文希望为未来增强推理的LLMs的研究和实际应用提供有价值的见解。