摘要
arXiv:2504.20117v2 宣告类型: replace-cross
摘要:本文介绍了一种名为 ResearchCodeAgent 的新型多智能体系统,该系统利用大型语言模型(LLMs)智能体来自动化机器学习文献中描述的研究方法的编码过程。该系统填补了高级研究概念与其实际实施之间的空白,允许研究人员自动生成基准测试或构建现有方法的代码,这些方法在文献中有部分或完整的起始代码可用。ResearchCodeAgent 采用灵活的智能体架构和全面的动作集,使其实现能够适应研究环境的上下文交互。系统集成了动态规划机制,利用短期和长期记忆进行迭代适应。我们在三个具有不同任务复杂性的不同机器学习任务上评估了 ResearchCodeAgent:数据增强、优化和数据批处理。我们的结果表明该系统的有效性和通用性,有 46.9% 的生成代码是高质量且无错误的,25% 的代码在基线实现上展示了性能改进。实证分析显示,与手动实现相比,平均减少了 57.9% 的编码时间。我们观察到在更复杂的任务上获得更高的收益。ResearchCodeAgent 代表了自动化研究实施过程的重要一步,有可能加速机器学习研究的步伐。