LLM2D

摘要

基于潜在变量的生成模型，例如生成对抗网络 (GAN) 和变分自编码器 (VAE)，由于其在许多领域展现出的出色性能而获得了广泛关注。然而，许多数据，例如自然图像，通常并不填充环境欧几里得空间，而是位于一个低维流形中。因此，对潜在维度的选择不当会导致无法揭示数据的结构，可能导致潜在表示不匹配，生成质量低下。为了解决这些问题，我们提出了一种名为潜在 Wasserstein GAN (LWGAN) 的新框架，该框架融合了 Wasserstein 自编码器和 Wasserstein GAN，以便通过修改后的信息潜在分布自适应地学习数据流形的内在维度。我们证明存在编码网络和生成网络，使得学习到的编码分布的内在维度等于数据流形的维度。我们从理论上证明，我们估计的内在维度是数据流形真实维度的相容估计。同时，我们为 LWGAN 的泛化误差提供了一个上限，这意味着我们从总体角度迫使合成数据分布与真实数据分布相似。全面的实证实验验证了我们的框架，并表明 LWGAN 能够在多种情况下识别正确的内在维度，并通过从学习到的潜在分布中采样同时生成高质量的合成数据。