摘要
arXiv:2502.04689v2 宣告类型: replace-cross
摘要:大型语言模型(LLMs)在许多具有挑战性的基准上取得了出色的表现,这些基准通常以多项选择问答(QA)任务的形式出现。零样本链式思考(CoT)提示增强了LLMs的推理能力,但提供的指导只有模糊且通用的思路(“一步一步地思考”)。本文介绍了一种直观且有效的零样本提示方法ARR,该方法明确地将QA解题中的三个关键步骤:分析问题的意图、检索相关信息以及逐步推理包含其中。针对多种多样且具有挑战性的QA任务进行的全面实验表明,ARR始终能改进没有使用ARR提示的基线模型,并且优于CoT。消除实验和案例研究进一步验证了每个组件——分析、检索和推理——的积极作用。值得注意的是,在ARR中,意图分析起着关键作用。此外,针对各种模型大小、LLM系列和生成设置的广泛评估进一步巩固了ARR的有效性、鲁棒性和普适性。