摘要
arXiv:2405.14075v2 宣告类型: replace-cross
摘要:大规模语言模型(LLMs)已成为人工智能中强大的工具,尤其是在复杂决策场景中,但它们静态的问题解决策略往往限制了其在动态环境中的适应性。我们通过一种称为 $T^2$ of Thoughts ($T^2oT$) 的启发式算法,利用温度树 ($T^2$) 激励来探索增强LLMs的推理能力。主要关注通过动态调整搜索参数,特别是温度,来提高决策过程的准确性,而不增加计算需求。我们实验证明,我们提出的混合 $T^2oT$ 方法在单解准确性、多解生成和文本生成质量方面都取得了改进。我们的研究发现,虽然基于温度动态调整搜索深度的结果参差不齐,但在 $T^2oT$ 的适应能力配合下的固定搜索深度提供了更可靠和多功能的问题解决策略。这项工作强调了未来在优化算法与基础语言模型互动方面的可能性,特别是通过我们在24点游戏和创造性写作任务中的开发进行说明。