摘要
arXiv:2505.08830v1 宣告类型: cross
摘要:大型语言模型(LLMs)和联邦学习(FL)的结合为在分布式数据上进行联合培训提供了前景,同时保持隐私并解决数据孤岛问题。然而,这一新兴领域,即联邦大型语言模型(FLLM),面临诸多挑战,包括通信和计算开销、异构性、隐私和安全问题。当前的研究主要集中在FLLM的可能性上,但未来趋势预计将更侧重于增强系统的稳健性和安全性。本文对FLLM的最新进展进行了全面的回顾,从四个关键视角审视挑战:可行性、稳健性、安全性和未来方向。我们对现有关于FLLM可行性的研究进行了详尽的综述,介绍了在资源、数据和任务异构性面前增强稳健性的方法,并分析了该集成带来的新型风险,包括隐私威胁和安全挑战。我们还回顾了最新的防御机制进展,并探讨了如少样本学习、机器遗忘和知识产权保护等有前途的未来研究方向。本文突出了进一步研究的紧迫需求,旨在增强系统的稳健性和安全性,同时解决联邦学习与大型语言模型集成所带来的独特挑战。