摘要
我们提出了两种新的评估指标,用于基于归一化流来评估生成图像的真实性:一种更简单、更高效的基于流的似然距离 (FLD) 和一种更精确的双流基于似然距离 (D-FLD)。由于归一化流可以用来计算精确的似然,因此所提出的指标评估了生成图像与给定域中真实图像分布的匹配程度。这种特性使所提出的指标比广泛使用的 Fr\'echet inception distance (FID) 和其他最近的指标具有几个优势。首先,所提出的指标只需要几百张图像就能稳定(平均收敛),而 FID 需要数万张,其他指标至少需要几千张。这使得即使是对少量生成的图像集,例如训练循环中的验证批次,也能进行可靠的评估。其次,与用来计算 FID 的 Inception-V3 相比,用来计算所提出指标的网络的参数数量减少了一个数量级以上,使其在计算上更有效。为了评估新领域(例如,X 射线图像)中生成图像的真实性,理想情况下,这些网络应该在真实图像上重新训练,以模拟它们独特的分布。因此,我们较小的网络对于新领域来说将更有优势。大量的实验表明,所提出的指标与各种类型的图像退化程度具有期望的单调关系。