摘要
arXiv:2504.12951v1 通告类型: cross
摘要: 近年来,大规模语言模型(LLMs)的发展促进了通用自主代理的发展,展示了在各种领域复杂推理任务中的出色表现。这一进展推动了基于提示的推理框架的迅速发展。最近的一个重点是迭代推理策略,这些策略通过自我评估和口头反馈来改进输出。然而,这些策略要求额外的计算复杂性,以使模型能够识别并纠正错误,从而导致它们的成本显著增加。在本文中,我们引入了“无反馈重试”的概念,这是一种简单而强大的机制,通过允许LLMs在识别错误答案时重试问题解决尝试来增强推理框架。与传统的迭代改进方法不同,我们的方法不需要显式的自我反思或口头反馈,简化了改进过程。我们的研究结果表明,基于重试的简单方法往往优于更复杂的推理框架,这表明复杂方法的成本效益并不总是合理的。通过挑战传统假设,即更复杂的推理策略必然导致更好的性能,我们的研究为如何通过更简单、更高效的手段实现最优结果提供了新的见解。所以,重试就是你需要的一切吗?