LLM2D

摘要

arXiv:2503.23934v1 宣告类型：交叉摘要：本研究对现实世界 MLOps 管道中辨别性 AI 和生成性 AI 模型的能耗进行了实证探讨。对于辨别性模型，我们研究了训练和推理中各种架构和超参数，并识别出能效最佳的实践方法。对于生成性 AI，主要评估了大型语言模型 (LLMs) 在不同模型规模和服务请求变化下的能耗情况。本研究采用基于软件的能耗测量，以确保在多种配置、模型和数据集上都能轻松复现。我们分析了多个模型和硬件配置，以发现各种指标之间的关联，识别出对能耗有显著影响的关键因素。结果表明，对于辨别性模型，优化架构、超参数和硬件可以显著降低能耗，同时不影响性能。对于 LLMs，能耗效率取决于模型大小、推理复杂度和请求处理能力之间的平衡，因为即使在利用率较低时，较大模型也不一定消耗更多能量。此分析为设计绿色和可持续的 ML 操作提供了实用指南，强调在保持性能的前提下减少能耗和碳足迹。本文可作为准确估算不同类型 AI 模型总能耗的标准。