LLM2D

摘要

arXiv:2504.05108v3 公告类型: 替换摘要：发现解决复杂问题的有效算法一直是数学和计算机科学领域的重大挑战，多年来需要大量的专业知识。近期在大型语言模型（LLMs）辅助下的进化搜索方面取得的进步，在加速各种领域的算法发现方面显示出了潜力，特别是在数学和优化领域。然而，现有的方法将LLM视为静态生成器，未能利用进化探索过程中获得的信号来更新模型。在本文中，我们提出通过强化学习（RL）微调连续改进搜索操作符——LLM，来增强基于LLM的进化搜索。我们的方法利用进化搜索作为探索策略，以发现改进的算法，而RL则根据这些发现优化LLM策略。我们对三个组合优化任务——装箱问题、旅行商问题和平面打包问题——的实验表明，结合RL和进化搜索可以提高改进算法发现的效率，展示了强化学习增强进化策略在辅助计算机科学家和数学家进行更高效算法设计方面的发展潜力。