摘要
arXiv:2312.14628v2 宣告类型: replace-cross
摘要:鉴于新兴的法律要求和政策更加关注隐私保护,各行各业的公司越来越倾向于采用联邦学习(FL)。这一去中心化的方法涉及多个客户端或孤岛,在中心服务器的协调下,利用各自的私人本地数据协作训练全局模型。与传统需要数据共享和传输的方法不同,跨孤岛联邦学习(Cross-Silo FL)允许客户端分享模型更新而非原始数据,从而增强隐私保护。尽管跨孤岛联邦学习正在被广泛应用,但由于该领域研究有限,对其碳影响的理解仍然不足。本研究旨在通过在整个AI产品生命周期中评估跨孤岛联邦学习的可持续性,来弥补这一空白,而不仅是停留在模型训练阶段的分析。我们系统地对比了这一去中心化方法与传统中心化方法,并提出了一种强大的定量框架,用于评估实际跨孤岛联邦学习环境中的成本和二氧化碳排放。我们的研究发现,在模型训练的能源消耗和成本方面,跨孤岛联邦学习与中心化学习是可比的。然而,中心化学习额外的数据传输和存储需求会导致显著且经常被忽视的二氧化碳排放。此外,我们引入了一个创新的数据和应用管理系统,将跨孤岛联邦学习和分析集成,旨在提高信息技术企业的可持续性和经济效率。