LLM2D

摘要

arXiv:2505.08830v1 宣告类型: cross 摘要：大型语言模型（LLMs）和联邦学习（FL）的结合为在分布式数据上进行联合培训提供了前景，同时保持隐私并解决数据孤岛问题。然而，这一新兴领域，即联邦大型语言模型（FLLM），面临诸多挑战，包括通信和计算开销、异构性、隐私和安全问题。当前的研究主要集中在FLLM的可能性上，但未来趋势预计将更侧重于增强系统的稳健性和安全性。本文对FLLM的最新进展进行了全面的回顾，从四个关键视角审视挑战：可行性、稳健性、安全性和未来方向。我们对现有关于FLLM可行性的研究进行了详尽的综述，介绍了在资源、数据和任务异构性面前增强稳健性的方法，并分析了该集成带来的新型风险，包括隐私威胁和安全挑战。我们还回顾了最新的防御机制进展，并探讨了如少样本学习、机器遗忘和知识产权保护等有前途的未来研究方向。本文突出了进一步研究的紧迫需求，旨在增强系统的稳健性和安全性，同时解决联邦学习与大型语言模型集成所带来的独特挑战。