摘要
arXiv:2502.01707v1 宣布类型: 交叉
摘要:盲去雾图像质量评估(BDQA),旨在在没有参考信息的情况下准确预测去雾图像的视觉质量,对于图像去雾算法的评估、比较和优化至关重要。现有的基于学习的BDQA方法已经取得了显著的成功,但DQA数据集的小规模限制了它们的性能。为了解决这一问题,本文提出将预训练在大规模图像-文本对上的对比语言-图像预训练(CLIP)适应到BDQA任务中。具体而言,受到人类视觉系统根据层次化特征理解图像这一事实的启发,我们将去雾图像的全局和局部信息作为CLIP的输入。为了准确地将去雾图像的输入层次化信息映射到质量得分,我们通过提示学习微调CLIP的视觉分支和语言分支。在两个真实的DQA数据集上的实验结果表明,我们提出的CLIP-DQA方法在现有BDQA方法上实现了更准确的质量预测。代码可在https://github.com/JunFu1995/CLIP-DQA获得。