LLM2D

摘要

arXiv:2502.12176v1 宣告类型: cross 摘要: 联邦基础模型（FedFMs）代表了一种分布式学习范式，它融合了基础模型的通用能力和联邦学习的隐私保护能力。这种结合使得大规模的基础模型和远程客户端的局部领域模型能够在教师-学生的学习设置中相互学习。本文全面总结了FedFMs中固有的十个具有挑战性的问题，包括基础理论、私有数据的利用、持续学习、遗忘、非IID和图数据、双向知识传递、激励机制设计、博弈机制设计、模型水印以及效率。这十个具有挑战性的问题体现在五个关键方面：“基础理论”，旨在为FedFMs建立一个一致和统一的理论框架。“数据”，解决在利用私人数据中的特定领域知识的同时保持隐私的困难；“异构性”，考察不同客户的数据、模型和计算资源的变化；“安全与隐私”，重点关注对抗恶意攻击和模型盗窃的防御；以及“效率”，强调在训练、通信和参数效率方面的改进。对于每个问题，我们提供了一个明确的数学定义的目标函数，分析现有方法，并讨论关键挑战和潜在的解决方案。通过深入探索，旨在推进FedFMs的理论基础，指导实际实施，并激发未来的研究所面临的这些障碍，从而实现各种实际应用中稳健、高效和隐私保护的FedFMs。