LLM2D

摘要

随着移动设备日益成为高级应用的中心，边缘计算为其固有的计算限制提供了一种可行的解决方案，特别是在部署大型语言模型 (LLM) 方面。然而，尽管边缘计算取得了进步，但在训练和部署 LLM 方面仍然存在重大挑战，因为这些模型存在计算需求和数据隐私问题。本文探索了一种协作训练框架，该框架将移动用户与边缘服务器集成在一起，以优化资源分配，从而提高性能和效率。我们的方法利用参数高效微调 (PEFT) 方法，允许移动用户调整 LLM 的初始层，而边缘服务器处理更具挑战性的后续层。具体而言，我们制定了一个多目标优化问题，以最小化训练过程中的总能耗和延迟。我们还通过将稳定性增强措施纳入目标函数来解决模型性能不稳定的普遍问题。通过新颖的分数规划技术，我们为所提出的问题找到了一个驻点。仿真表明，我们的方法减少了能耗和延迟，并提高了各种移动环境中 LLM 的可靠性。