LLM2D
绿色MLOps至绿色GenOps:一项鉴别性与生成性AI操作的能耗实证研究
Green MLOps to Green GenOps: An Empirical Study of Energy Consumption in Discriminative and Generative AI Operations
作者: Adri\'an S\'anchez-Momp\'o, Ioannis Mavromatis, Peizheng Li, Konstantinos Katsaros, Aftab Khan
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23934v1

摘要

arXiv:2503.23934v1 宣告类型:交叉 摘要:本研究对现实世界 MLOps 管道中辨别性 AI 和生成性 AI 模型的能耗进行了实证探讨。对于辨别性模型,我们研究了训练和推理中各种架构和超参数,并识别出能效最佳的实践方法。对于生成性 AI,主要评估了大型语言模型 (LLMs) 在不同模型规模和服务请求变化下的能耗情况。本研究采用基于软件的能耗测量,以确保在多种配置、模型和数据集上都能轻松复现。我们分析了多个模型和硬件配置,以发现各种指标之间的关联,识别出对能耗有显著影响的关键因素。结果表明,对于辨别性模型,优化架构、超参数和硬件可以显著降低能耗,同时不影响性能。对于 LLMs,能耗效率取决于模型大小、推理复杂度和请求处理能力之间的平衡,因为即使在利用率较低时,较大模型也不一定消耗更多能量。此分析为设计绿色和可持续的 ML 操作提供了实用指南,强调在保持性能的前提下减少能耗和碳足迹。本文可作为准确估算不同类型 AI 模型总能耗的标准。