LLM2D

摘要

arXiv:2502.11422v1 优化类型: 新摘要: 启发式方法在解决组合优化问题（COPs）方面取得了巨大成功。然而，由人类设计的启发式方法需要太多的领域知识和测试时间。鉴于大型语言模型（LLMs）具备强大的理解和生成内容的能力，并且拥有涵盖多种领域的知识库，这提供了一种新的自动优化启发式方法的方式。因此，我们提出了启发式规划（PoH），一种将大型语言模型的自我反思与蒙特卡洛树搜索（MCTS，一种广为人知的规划算法）结合起来的优化方法。PoH 通过评估生成的启发式方法的表现并提供改进建议，逐步细化生成的启发式方法。我们的方法通过有效模拟未来状态来搜索具有更高奖励的路径，从而迭代评估生成的启发式方法（状态）并基于改进建议（行动）和评估结果（奖励）进行改进。在这篇论文中，我们将 PoH 应用于解决旅行商问题（TSP）和流水线车间调度问题（FSSP）。实验结果表明，PoH 在克服其他手工艺品启发式方法和其他基于LLM的方法的自动化启发式设计（AHD）方面表现出色，并且在利用LLM的自动化启发式优化以解决COPs方面，我们的方法取得了显著的改进和最先进的性能。