LLM2D

摘要

arXiv:2504.20348v1 宣告类型: cross 摘要: 大型语言模型(LLMs)在边缘AI系统中实现了实时功能调用，但引入了显著的计算开销，导致高能耗和碳排放。现有方法注重性能优化，而忽视了可持续性，使得它们在能源受限的环境中效率低下。我们引入了CarbonCall，这是一个具有可持续性意识的功能调用框架，该框架集成了动态工具选择、碳意识执行和量化LLM适应性。CarbonCall根据实时的碳强度预测调整功率阈值，并在功率限制下切换模型变体以维持高每秒令牌吞吐量。在NVIDIA Jetson AGX Orin上的实验结果表明，CarbonCall在减少碳排放（最多52%）、降低能耗（30%）和缩短执行时间（30%）的同时，保持了高效运作。