LLM2D

摘要

arXiv:2503.20126v1 Announce Type: 横向研究摘要：快速的技术进步加速了各种领域和应用场景中的软件开发，从而增加了全球碳排放的比例。尽管最近的大语言模型（LLMs）声称能够帮助开发者优化代码以提高性能和能源效率，但在实际应用场景中的效果仍然有待探索。在这项工作中，我们研究了LLMs在减少实际项目环境足迹方面的有效性，重点关注广泛应用于学术界和工业界的 Matlab 代码，这些代码用于科学和工程应用。我们分析了来自 100 个顶级 GitHub 仓库的 400 个脚本的能源焦点优化。我们检查了来自领先的大语言模型，如 GPT-3、GPT-4、Llama 和 Mixtral，以及一位资深的 Matlab 开发者的推荐的 2,176 个优化建议，这些优化涉及能源消耗、内存使用、执行时间消耗和代码正确性。开发者作为实际基准，用于比较典型的人类和 LLM 生成的优化。我们将这些优化映射到 13 个高层次主题后，发现大语言模型提出了广泛范围的改进--不仅仅是能源效率，还包括提高代码可读性和可维护性、内存管理、错误处理等方面。然而，我们的统计测试揭示出，能源焦点的优化意外地对内存使用产生了负面影响，且没有明显的执行时间或能源消耗方面的益处。我们对能源-时间权衡的定性分析表明，某些主题，如向量化预分配，是这些权衡的主要形成因素。随着大语言模型在现代软件开发中的普及，我们的研究呼吁优先评估常见的编程实践，以识别那些环保的做法。