LLM2D

摘要

arXiv:2503.22658v1 Announce Type: 对比摘要：超分辨、修复、全图像生成、无配对风格转换和网络约束图像重建各自包含一种实际地面真实值在使用时未知的机器学习图像合成方面。一般而言，在定量和权威性地评估合成图像的质量方面存在困难；然而，在关键医疗保健场景中，稳健的评估至关重要。在这项工作中，所有的实际图像到图像比较其实是相对评估，而不是绝对差异的量化；因此，可以使用Tversky指数进行生成图像质量的有意义评估，这是一个广泛认可的评估感知相似性的度量。该评估程序首先开发，然后使用多个真实和模拟图像数据集进行演示。主要结果是，当将任何特征编码选择的主观性和内在缺陷置于首位时，Tversky的方法会产生直观的结果，而基于总结深层特征空间距离的传统方法则不会。