LLM2D

摘要

arXiv:2502.04689v2 宣告类型: replace-cross 摘要：大型语言模型（LLMs）在许多具有挑战性的基准上取得了出色的表现，这些基准通常以多项选择问答（QA）任务的形式出现。零样本链式思考（CoT）提示增强了LLMs的推理能力，但提供的指导只有模糊且通用的思路（“一步一步地思考”）。本文介绍了一种直观且有效的零样本提示方法ARR，该方法明确地将QA解题中的三个关键步骤：分析问题的意图、检索相关信息以及逐步推理包含其中。针对多种多样且具有挑战性的QA任务进行的全面实验表明，ARR始终能改进没有使用ARR提示的基线模型，并且优于CoT。消除实验和案例研究进一步验证了每个组件——分析、检索和推理——的积极作用。值得注意的是，在ARR中，意图分析起着关键作用。此外，针对各种模型大小、LLM系列和生成设置的广泛评估进一步巩固了ARR的有效性、鲁棒性和普适性。