LLM2D

摘要

arXiv:2504.20117v2 宣告类型: replace-cross 摘要：本文介绍了一种名为 ResearchCodeAgent 的新型多智能体系统，该系统利用大型语言模型（LLMs）智能体来自动化机器学习文献中描述的研究方法的编码过程。该系统填补了高级研究概念与其实际实施之间的空白，允许研究人员自动生成基准测试或构建现有方法的代码，这些方法在文献中有部分或完整的起始代码可用。ResearchCodeAgent 采用灵活的智能体架构和全面的动作集，使其实现能够适应研究环境的上下文交互。系统集成了动态规划机制，利用短期和长期记忆进行迭代适应。我们在三个具有不同任务复杂性的不同机器学习任务上评估了 ResearchCodeAgent：数据增强、优化和数据批处理。我们的结果表明该系统的有效性和通用性，有 46.9% 的生成代码是高质量且无错误的，25% 的代码在基线实现上展示了性能改进。实证分析显示，与手动实现相比，平均减少了 57.9% 的编码时间。我们观察到在更复杂的任务上获得更高的收益。ResearchCodeAgent 代表了自动化研究实施过程的重要一步，有可能加速机器学习研究的步伐。