摘要
arXiv:2502.11422v1 优化类型: 新
摘要: 启发式方法在解决组合优化问题(COPs)方面取得了巨大成功。然而,由人类设计的启发式方法需要太多的领域知识和测试时间。鉴于大型语言模型(LLMs)具备强大的理解和生成内容的能力,并且拥有涵盖多种领域的知识库,这提供了一种新的自动优化启发式方法的方式。因此,我们提出了启发式规划(PoH),一种将大型语言模型的自我反思与蒙特卡洛树搜索(MCTS,一种广为人知的规划算法)结合起来的优化方法。PoH 通过评估生成的启发式方法的表现并提供改进建议,逐步细化生成的启发式方法。我们的方法通过有效模拟未来状态来搜索具有更高奖励的路径,从而迭代评估生成的启发式方法(状态)并基于改进建议(行动)和评估结果(奖励)进行改进。在这篇论文中,我们将 PoH 应用于解决旅行商问题(TSP)和流水线车间调度问题(FSSP)。实验结果表明,PoH 在克服其他手工艺品启发式方法和其他基于LLM的方法的自动化启发式设计(AHD)方面表现出色,并且在利用LLM的自动化启发式优化以解决COPs方面,我们的方法取得了显著的改进和最先进的性能。