摘要
自动化机器学习 (AutoML) 方法包括优化固定流水线以进行模型选择和集成之类的传统方法,以及自主构建流水线的新型基于大型语言模型 (LLM) 的框架。虽然基于 LLM 的代理在自动化机器学习任务方面显示出前景,但即使经过多次迭代,它们也常常会生成多样性低且次优的代码。为了克服这些限制,我们引入了树搜索增强型 LLM 代理 (SELA),这是一个创新的基于代理的系统,它利用蒙特卡洛树搜索 (MCTS) 来优化 AutoML 流程。通过将流水线配置表示为树,我们的框架使代理能够智能地进行实验并迭代地改进其策略,从而更有效地探索机器学习解决方案空间。这种新颖的方法允许 SELA 根据实验反馈发现最佳路径,从而提高解决方案的整体质量。在对 20 个机器学习数据集进行的广泛评估中,我们将传统 AutoML 方法和基于代理的 AutoML 方法的性能进行了比较,结果表明,在所有数据集上,SELA 对每个基准的胜率为 65% 到 80%。这些结果强调了基于代理的策略在 AutoML 中的巨大潜力,为解决复杂的机器学习挑战提供了新的视角。