LLM2D

摘要

arXiv:2502.01707v1 通知类型: 跨领域摘要: 盲去雾图像质量评估（BDQA），其目标是在没有任何参考信息的情况下准确预测去雾图像的视觉质量，对于图像去雾算法的评估、比较和优化至关重要。现有的基于学习的BDQA方法已经取得了显著的成功，但DQA数据集规模较小限制了它们的性能。为了解决这一问题，本文提出将预训练在大规模图像-文本对上的对比语言-图像预训练（CLIP）适应到BDQA任务中。具体而言，由于人类视觉系统基于层次特征来理解图像的事实，我们将去雾图像的全局和局部信息作为CLIP的输入。为了准确地将去雾图像的输入层次信息映射到质量分数，我们通过提示学习调整CLIP的视觉分支和语言分支。在两个真实DQA数据集上的实验结果表明，我们提出的方法CLIP-DQA在现有的BDQA方法上实现了更准确的质量预测。代码可在 https://github.com/JunFu1995/CLIP-DQA 获取。