LLM2D
CLIP-DQA:使用CLIP从全局和局部视角盲评去雾图像
CLIP-DQA: Blindly Evaluating Dehazed Images from Global and Local Perspectives Using CLIP
作者: Yirui Zeng, Jun Fu, Hadi Amirpour, Huasheng Wang, Guanghui Yue, Hantao Liu, Ying Chen, Wei Zhou
发布日期: 2/5/2025
arXiv ID: 2502.01707

摘要

arXiv:2502.01707v1 宣布类型: 交叉 摘要:盲去雾图像质量评估(BDQA),旨在在没有参考信息的情况下准确预测去雾图像的视觉质量,对于图像去雾算法的评估、比较和优化至关重要。现有的基于学习的BDQA方法已经取得了显著的成功,但DQA数据集的小规模限制了它们的性能。为了解决这一问题,本文提出将预训练在大规模图像-文本对上的对比语言-图像预训练(CLIP)适应到BDQA任务中。具体而言,受到人类视觉系统根据层次化特征理解图像这一事实的启发,我们将去雾图像的全局和局部信息作为CLIP的输入。为了准确地将去雾图像的输入层次化信息映射到质量得分,我们通过提示学习微调CLIP的视觉分支和语言分支。在两个真实的DQA数据集上的实验结果表明,我们提出的CLIP-DQA方法在现有BDQA方法上实现了更准确的质量预测。代码可在https://github.com/JunFu1995/CLIP-DQA获得。