摘要
arXiv:2504.06307v1 通告类型: cross
摘要: 大型语言模型(LLMs)的快速采用导致了显著的能源消耗和碳排放,对生成型人工智能技术的可持续性构成了关键性挑战。本文探讨了在LLM部署中整合高效的能源优化技术,以应对这些环境问题。我们展示了案例研究和框架,证明了通过战略性量化和局部推理技术,可以在不牺牲其操作有效性的情况下大幅降低LLM的碳足迹。实验结果表明,这些方法在量化后可降低高达45%的能源消耗和碳排放,使其特别适合资源限制的环境。研究结果提供了实现人工智能可持续性方面的可操作见解,同时保持高准确性和响应性。