摘要
arXiv:2504.12477v1 宣告类型: 新
摘要: 本文介绍了一种基于大规模语言模型(LLM)的对话代理系统,旨在增强机器学习运营(MLOps)中的人机协作。我们引入了Swarm Agent,这是一种可扩展的架构,通过自然语言交互整合专门的代理以创建和管理ML工作流。该系统利用了一种分层、模块化的设计,其中包括KubeFlow Pipelines (KFP) Agent用于ML流水线编排,MinIO Agent用于数据管理,以及Retrieval-Augmented Generation (RAG) Agent用于领域特定知识的集成。通过迭代的推理循环和上下文感知的处理,该系统使具有不同技术背景的用户能够发现、执行和监控ML流水线;管理和组织数据集和制品;并通过直观的对话界面访问相关文档。我们的方法解决了复杂MLOps平台(如Kubeflow)的可访问性问题,使其先进的ML工具广泛可及,同时保持了与其他平台扩展的灵活性。本文描述了该系统的架构、实现细节,并展示了这种对话MLOps助手如何降低不同技术水平的用户进入MLOps的复杂性和壁垒。