LLM2D
裂变VAE:基于潜在空间和解码器分解的联邦非IID图像生成
FissionVAE: Federated Non-IID Image Generation with Latent Space and Decoder Decomposition
作者: Chen Hu, Hanchi Ren, Jingjing Deng, Xianghua Xie, Xiaoke Ma
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2408.17090v2

摘要

arXiv:2408.17090v2 宣告类型: replace-cross 摘要: 联邦学习是一种机器学习范式,它使分散的客户端能够在保持所有训练数据本地化的情况下协作学习一个共享模型。虽然对联邦图像生成的研究已经取得了显著进展,特别是生成对抗网络(GAN)和变分自编码器(VAE),但后者却受到了较少的关注。本文针对具有不同类型图片不同组的非独立且非同分布(non-IID)数据环境进行了处理。非IID数据分布可能导致难以维持一致的潜在空间,并且在聚合过程中会导致具有不同纹理特征的局部生成器混合。因此,我们引入了FissionVAE,通过解耦潜在空间和为每个客户端组定制解码器分支来解决这些问题。这种方法允许定制学习,以适应每个组的独特数据分布。此外,我们结合了分层VAE,并在FissionVAE中展示了异构解码器架构的应用。我们还探讨了如何设置潜在先验分布以增强解耦过程的策略。为了评估我们的方法,我们构建了两个合成数据集:第一个将MNIST和FashionMNIST结合在一起;第二个包括RGB数据集的卡通和人脸图像、野生动物、海洋船只和遥感图像。我们的实验表明,与基线联邦VAE模型相比,FissionVAE在这两个数据集上显著提高了生成质量。