LLM2D
碳足迹回调:面向边缘设备的大语言模型可持续性意识函数调用
CarbonCall: Sustainability-Aware Function Calling for Large Language Models on Edge Devices
作者: Varatheepan Paramanayakam, Andreas Karatzas, Iraklis Anagnostopoulos, Dimitrios Stamoulis
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2504.20348v2

摘要

arXiv:2504.20348v2 通知类型: replace-cross 摘要: 大型语言模型(LLMs)使边缘人工智能系统能够实时调用函数,但这也导致了显著的计算开销,进而产生了高昂的能源消耗和碳排放。现有方法虽然优化了性能,但却忽视了可持续性,使其在能源受限的环境中效率低下。我们提出了CarbonCall,这是一种具有可持续性意识的函数调用框架,集成了动态工具选择、碳意识执行和量化LLM适应。CarbonCall根据实时碳强度预测调整功率阈值,并在功率限制条件下切换模型变体以维持高每秒令牌吞吐量。在NVIDIA Jetson AGX Orin上的实验表明,CarbonCall能够将碳排放减少52%,功耗减少30%,执行时间减少30%,同时还保持了高效率。