LLM2D

摘要

arXiv:2504.12951v1 通告类型: cross 摘要: 近年来，大规模语言模型（LLMs）的发展促进了通用自主代理的发展，展示了在各种领域复杂推理任务中的出色表现。这一进展推动了基于提示的推理框架的迅速发展。最近的一个重点是迭代推理策略，这些策略通过自我评估和口头反馈来改进输出。然而，这些策略要求额外的计算复杂性，以使模型能够识别并纠正错误，从而导致它们的成本显著增加。在本文中，我们引入了“无反馈重试”的概念，这是一种简单而强大的机制，通过允许LLMs在识别错误答案时重试问题解决尝试来增强推理框架。与传统的迭代改进方法不同，我们的方法不需要显式的自我反思或口头反馈，简化了改进过程。我们的研究结果表明，基于重试的简单方法往往优于更复杂的推理框架，这表明复杂方法的成本效益并不总是合理的。通过挑战传统假设，即更复杂的推理策略必然导致更好的性能，我们的研究为如何通过更简单、更高效的手段实现最优结果提供了新的见解。所以，重试就是你需要的一切吗？