摘要
基于潜在变量的生成模型,例如生成对抗网络 (GAN) 和变分自编码器 (VAE),由于其在许多领域展现出的出色性能而获得了广泛关注。然而,许多数据,例如自然图像,通常并不填充环境欧几里得空间,而是位于一个低维流形中。因此,对潜在维度的选择不当会导致无法揭示数据的结构,可能导致潜在表示不匹配,生成质量低下。为了解决这些问题,我们提出了一种名为潜在 Wasserstein GAN (LWGAN) 的新框架,该框架融合了 Wasserstein 自编码器和 Wasserstein GAN,以便通过修改后的信息潜在分布自适应地学习数据流形的内在维度。我们证明存在编码网络和生成网络,使得学习到的编码分布的内在维度等于数据流形的维度。我们从理论上证明,我们估计的内在维度是数据流形真实维度的相容估计。同时,我们为 LWGAN 的泛化误差提供了一个上限,这意味着我们从总体角度迫使合成数据分布与真实数据分布相似。全面的实证实验验证了我们的框架,并表明 LWGAN 能够在多种情况下识别正确的内在维度,并通过从学习到的潜在分布中采样同时生成高质量的合成数据。