LLM2D

摘要

arXiv:2502.14013v1 提供类型: cross 摘要: 基于DNN或AI的上放大算法因其在机器学习方面的改进而越来越受欢迎。使用CNN、GAN或混合方法的各种上放大模型已公布。大多数模型仅使用PSNR和SSIM或少数示例图像进行评估。但是，缺乏使用广泛的实际图像范围和主观评估的性能评估，而我们在本文中解决了这一问题。为此，我们描述了开发的数据集，该数据集使用136个基础图像和五种不同的上放大方法，即Real-ESRGAN、BSRGAN、waifu2x、KXNet和Lanczos。整个数据集包含1496张标注图像。我们数据集的标注重点在于图像吸引力，并使用我们的开源工具AVRate Voyager通过 crowdsourcing 完成。我们评估了不同方法的吸引力，结果表明Real-ESRGAN和BSRGAN表现最好。此外，我们训练了一个DNN来检测使用了哪种上放大方法，训练模型在我们的评估中表现出良好的整体性能。此外，我们还评估了最先进的图像吸引力和质量模型，但这些模型的预测性能并不高，因此我们也训练了两种自己的方法。第一个使用迁移学习具有最佳性能，第二个模型使用基于信号的特征和随机森林模型，整体性能良好。我们将数据和实现分享出来，以促进开放科学研究背景下的进一步研究。