摘要
arXiv:2502.14013v1 提供类型: cross
摘要: 基于DNN或AI的上放大算法因其在机器学习方面的改进而越来越受欢迎。使用CNN、GAN或混合方法的各种上放大模型已公布。大多数模型仅使用PSNR和SSIM或少数示例图像进行评估。但是,缺乏使用广泛的实际图像范围和主观评估的性能评估,而我们在本文中解决了这一问题。为此,我们描述了开发的数据集,该数据集使用136个基础图像和五种不同的上放大方法,即Real-ESRGAN、BSRGAN、waifu2x、KXNet和Lanczos。整个数据集包含1496张标注图像。我们数据集的标注重点在于图像吸引力,并使用我们的开源工具AVRate Voyager通过 crowdsourcing 完成。我们评估了不同方法的吸引力,结果表明Real-ESRGAN和BSRGAN表现最好。此外,我们训练了一个DNN来检测使用了哪种上放大方法,训练模型在我们的评估中表现出良好的整体性能。此外,我们还评估了最先进的图像吸引力和质量模型,但这些模型的预测性能并不高,因此我们也训练了两种自己的方法。第一个使用迁移学习具有最佳性能,第二个模型使用基于信号的特征和随机森林模型,整体性能良好。我们将数据和实现分享出来,以促进开放科学研究背景下的进一步研究。