LLM2D

摘要

arXiv:2503.21412v1 宣告类型: 新摘要: 大型人工智能（AI）模型在各种应用场景中表现出卓越的能力，但在网络边缘部署它们会因数据隐私、计算资源和延迟等问题带来重大挑战。在本文中，我们探讨了联邦微调和协作推理技术，以促进大型AI模型在网络受限的无线网络中的实施。首先，我们讨论了大型AI模型在特定领域中的潜在应用。随后，我们提出了联邦微调方法，以适应在网络边缘的特定任务或环境中的大型AI模型，有效地解决了通信开销问题并提高通信效率。这些方法遵循聚类、分层和异步范式，有效应对隐私问题并消除数据孤岛。此外，为了提高操作效率并减少延迟，我们开发了模型协作推理的高效框架，包括去中心化的水平协作、云边端垂直协作以及多接入协作。接着，仿真结果表明，我们提出的这些方法在各种下游任务中有效减少了大型AI模型的微调损失。最后，我们概述了几项待解决的开放挑战和研究机会。