摘要
arXiv:2503.22754v1 Announce Type: cross
摘要:人工智能和数据科学在各行业的兴起强调了有效管理机器学习(ML)模型并对其进行治理的迫切需求。传统的机器学习模型管理方法通常涉及分散的存储系统,并缺乏标准化的方法来实现版本管理、审计和重用。受数据湖概念的启发,本文提出了机器学习模型湖(Model Lake)的概念,作为组织内部用于数据集、代码和模型集中管理的框架。我们深入探讨了模型湖的概念,详细阐述了其架构基础、关键组件、操作优势以及实际挑战。我们讨论了采用模型湖方法的变革潜力,例如增强的模型生命周期管理、发现、审计和重用。此外,我们展示了模型湖的实际应用及其对数据、代码和模型管理实践的变革影响。