LLM2D
我们可以使代码变绿吗?理解LLMs与人类代码优化之间的权衡
Can We Make Code Green? Understanding Trade-Offs in LLMs vs. Human Code Optimizations
作者: Pooja Rani, Jan-Andrea Bard, June Sallou, Alexander Boll, Timo Kehrer, Alberto Bacchelli
发布日期: 3/27/2025
arXiv ID: oai:arXiv.org:2503.20126v1

摘要

arXiv:2503.20126v1 Announce Type: 横向研究 摘要:快速的技术进步加速了各种领域和应用场景中的软件开发,从而增加了全球碳排放的比例。尽管最近的大语言模型(LLMs)声称能够帮助开发者优化代码以提高性能和能源效率,但在实际应用场景中的效果仍然有待探索。在这项工作中,我们研究了LLMs在减少实际项目环境足迹方面的有效性,重点关注广泛应用于学术界和工业界的 Matlab 代码,这些代码用于科学和工程应用。我们分析了来自 100 个顶级 GitHub 仓库的 400 个脚本的能源焦点优化。我们检查了来自领先的大语言模型,如 GPT-3、GPT-4、Llama 和 Mixtral,以及一位资深的 Matlab 开发者的推荐的 2,176 个优化建议,这些优化涉及能源消耗、内存使用、执行时间消耗和代码正确性。开发者作为实际基准,用于比较典型的人类和 LLM 生成的优化。 我们将这些优化映射到 13 个高层次主题后,发现大语言模型提出了广泛范围的改进--不仅仅是能源效率,还包括提高代码可读性和可维护性、内存管理、错误处理等方面。然而,我们的统计测试揭示出,能源焦点的优化意外地对内存使用产生了负面影响,且没有明显的执行时间或能源消耗方面的益处。我们对能源-时间权衡的定性分析表明,某些主题,如向量化预分配,是这些权衡的主要形成因素。随着大语言模型在现代软件开发中的普及,我们的研究呼吁优先评估常见的编程实践,以识别那些环保的做法。