摘要
我们提出了两种新的评估指标,基于归一化流来评估生成图像的真实性:一种更简单、更高效的基于流的似然距离 (FLD) 和一种更精确的双流基于似然距离 (D-FLD)。由于归一化流可以用来计算精确的似然,因此所提出的指标评估了生成图像与给定域中真实图像分布的匹配程度。这一特性使所提出的指标比广泛使用的 Fréchet inception distance (FID) 和其他最近的指标具有几个优势。首先,所提出的指标只需要几百张图像就能稳定(在均值上收敛),而 FID 需要数万张图像,其他指标至少需要几千张图像。这使得即使是对少量生成的图像集(例如训练循环中的验证批次)也能进行可靠的评估。其次,用来计算所提出指标的网络参数数量比用来计算 FID 的 Inception-V3 少一个数量级以上,因此在计算上更高效。为了评估新领域(例如,X 射线图像)中生成图像的真实性,理想情况下,这些网络应该在真实图像上重新训练以模拟其独特的分布。因此,我们更小的网络在新的领域中将更加有利。大量的实验表明,所提出的指标与各种图像退化的程度具有所需的单调关系。