LLM2D

摘要

arXiv:2503.23314v1 通知类型: 新摘要: 大规模语言模型（LLMs）通过实现动态推理和适应性，革命性地改变了自动化数据分析和机器学习。尽管近年来的方法通过多智能体系统推进了多阶段管道的发展，但它们通常依赖于固定的单路径工作流程，限制了多样策略的探索和整合，经常导致预测结果欠佳。为了解决这些挑战，我们提出了一种名为 SPIO（顺序计划整合与优化）的新框架，该框架利用 LLM 驱动的决策来协调四个关键模块（数据预处理、特征工程、建模和超参数调整）中的多智能体规划。在每个模块中，专门的规划智能体独立生成候选策略，这些策略依次传递到后续阶段，促进全面的探索。计划优化智能体通过建议多个优化计划来改进这些策略。我们进一步引入了两种变体：SPIO-S，它根据 LLM 选择最佳解决方案路径，以及 SPIO-E，它选择前 k 个候选计划并将它们集成起来以最大化预测性能。在 Kaggle 和 OpenML 数据集上的广泛实验表明，SPIO 显著优于现有最先进的方法，提供了一种稳健且可扩展的自动化数据科学任务解决方案。