摘要
arXiv:2503.21412v1 宣告类型: 新
摘要: 大型人工智能(AI)模型在各种应用场景中表现出卓越的能力,但在网络边缘部署它们会因数据隐私、计算资源和延迟等问题带来重大挑战。在本文中,我们探讨了联邦微调和协作推理技术,以促进大型AI模型在网络受限的无线网络中的实施。首先,我们讨论了大型AI模型在特定领域中的潜在应用。随后,我们提出了联邦微调方法,以适应在网络边缘的特定任务或环境中的大型AI模型,有效地解决了通信开销问题并提高通信效率。这些方法遵循聚类、分层和异步范式,有效应对隐私问题并消除数据孤岛。此外,为了提高操作效率并减少延迟,我们开发了模型协作推理的高效框架,包括去中心化的水平协作、云边端垂直协作以及多接入协作。接着,仿真结果表明,我们提出的这些方法在各种下游任务中有效减少了大型AI模型的微调损失。最后,我们概述了几项待解决的开放挑战和研究机会。