LLM2D
CarbonCall: 呼叫关注可持续性的函数以供边缘设备上的大型语言模型使用
CarbonCall: Sustainability-Aware Function Calling for Large Language Models on Edge Devices
作者: Varatheepan Paramanayakam, Andreas Karatzas, Iraklis Anagnostopoulos, Dimitrios Stamoulis
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20348v1

摘要

arXiv:2504.20348v1 宣告类型: cross 摘要: 大型语言模型(LLMs)在边缘AI系统中实现了实时功能调用,但引入了显著的计算开销,导致高能耗和碳排放。现有方法注重性能优化,而忽视了可持续性,使得它们在能源受限的环境中效率低下。我们引入了CarbonCall,这是一个具有可持续性意识的功能调用框架,该框架集成了动态工具选择、碳意识执行和量化LLM适应性。CarbonCall根据实时的碳强度预测调整功率阈值,并在功率限制下切换模型变体以维持高每秒令牌吞吐量。在NVIDIA Jetson AGX Orin上的实验结果表明,CarbonCall在减少碳排放(最多52%)、降低能耗(30%)和缩短执行时间(30%)的同时,保持了高效运作。