LLM2D

摘要

arXiv:2404.05966v2 公告类型: 替换-交叉摘要: 我们介绍了THOUGHTSCULPT，这是一种适用于输出可以分解为组件的任务的通用推理和搜索方法。THOUGHTSCULPT 使用蒙特卡洛树搜索 (MCTS) 探索潜在解决方案的搜索树，逐步构建解决方案并根据任何领域特定启发式进行评估，实践中通常是简单的LLM评估器。关键的是，我们的操作空间包括修正操作：THOUGHTSCULPT 可能选择修正其部分先前输出，而不是继续构建其余输出。实验表明，THOUGHTSCULPT 在三个具有挑战性的任务上优于最先进的推理方法：故事梗概改进（最高提高30%的兴趣度）、微型填字游戏解题（最高提高16%的单词成功率）以及受约束生成（最高提高10%的概念覆盖面）。