LLM2D
节能导向的大型语言模型解码:文本生成策略对GPU能耗影响的研究
Energy-Conscious LLM Decoding: Impact of Text Generation Strategies on GPU Energy Consumption
作者: Alireza Nik, Michael A. Riegler, P{\aa}l Halvorsen
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.11723v1

摘要

arXiv:2502.11723v1 公告类型: 新增 摘要: 解码策略显著影响大规模语言模型(LLMs)生成文本的质量和多样性,但它们对计算资源消耗,特别是GPU能耗的影响仍研究不足。本文探讨了文本生成解码方法与能效之间的关系,重点关注生成质量和GPU能耗之间的权衡,特别是在多样化任务和解码配置下的表现。通过在翻译、代码总结和数学问题解决等不同文本生成任务中对标多个策略,我们揭示了选择合适的解码技术及其调优参数如何影响文本质量和资源利用率,并强调了平衡优化的必要性。据我们所知,本研究是首次从能耗角度探索LLMs中解码策略的研究,为设计能够在保持高质量文本生成的同时兼顾资源使用的应用程序提供了可操作的见解。