LLM2D

摘要

arXiv:2502.01707v1 宣布类型: 交叉摘要：盲去雾图像质量评估（BDQA），旨在在没有参考信息的情况下准确预测去雾图像的视觉质量，对于图像去雾算法的评估、比较和优化至关重要。现有的基于学习的BDQA方法已经取得了显著的成功，但DQA数据集的小规模限制了它们的性能。为了解决这一问题，本文提出将预训练在大规模图像-文本对上的对比语言-图像预训练（CLIP）适应到BDQA任务中。具体而言，受到人类视觉系统根据层次化特征理解图像这一事实的启发，我们将去雾图像的全局和局部信息作为CLIP的输入。为了准确地将去雾图像的输入层次化信息映射到质量得分，我们通过提示学习微调CLIP的视觉分支和语言分支。在两个真实的DQA数据集上的实验结果表明，我们提出的CLIP-DQA方法在现有BDQA方法上实现了更准确的质量预测。代码可在https://github.com/JunFu1995/CLIP-DQA获得。