LLM2D
SPIO:基于LLM的多智能体规划的集成与选择策略在自动化数据科学中的应用
SPIO: Ensemble and Selective Strategies via LLM-Based Multi-Agent Planning in Automated Data Science
作者: Wonduk Seo, Juhyeon Lee, Yi Bu
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23314v1

摘要

arXiv:2503.23314v1 通知类型: 新 摘要: 大规模语言模型(LLMs)通过实现动态推理和适应性,革命性地改变了自动化数据分析和机器学习。尽管近年来的方法通过多智能体系统推进了多阶段管道的发展,但它们通常依赖于固定的单路径工作流程,限制了多样策略的探索和整合,经常导致预测结果欠佳。为了解决这些挑战,我们提出了一种名为 SPIO(顺序计划整合与优化)的新框架,该框架利用 LLM 驱动的决策来协调四个关键模块(数据预处理、特征工程、建模和超参数调整)中的多智能体规划。在每个模块中,专门的规划智能体独立生成候选策略,这些策略依次传递到后续阶段,促进全面的探索。计划优化智能体通过建议多个优化计划来改进这些策略。我们进一步引入了两种变体:SPIO-S,它根据 LLM 选择最佳解决方案路径,以及 SPIO-E,它选择前 k 个候选计划并将它们集成起来以最大化预测性能。在 Kaggle 和 OpenML 数据集上的广泛实验表明,SPIO 显著优于现有最先进的方法,提供了一种稳健且可扩展的自动化数据科学任务解决方案。