LLM2D
THOUGHTSCULPT:中间修订与搜索的推理
THOUGHTSCULPT: Reasoning with Intermediate Revision and Search
作者: Yizhou Chi, Kevin Yang, Dan Klein
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2404.05966v2

摘要

arXiv:2404.05966v2 公告类型: 替换-交叉 摘要: 我们介绍了THOUGHTSCULPT,这是一种适用于输出可以分解为组件的任务的通用推理和搜索方法。THOUGHTSCULPT 使用蒙特卡洛树搜索 (MCTS) 探索潜在解决方案的搜索树,逐步构建解决方案并根据任何领域特定启发式进行评估,实践中通常是简单的LLM评估器。关键的是,我们的操作空间包括修正操作:THOUGHTSCULPT 可能选择修正其部分先前输出,而不是继续构建其余输出。实验表明,THOUGHTSCULPT 在三个具有挑战性的任务上优于最先进的推理方法:故事梗概改进(最高提高30%的兴趣度)、微型填字游戏解题(最高提高16%的单词成功率)以及受约束生成(最高提高10%的概念覆盖面)。