摘要
arXiv:2408.10619v2 宣告类型: replace-cross
摘要:我们提出了一种统一的变化检测管道,该管道结合了实例级别的掩码、去噪扩散模型内的多尺度注意力以及每个像素的语义分类,并通过SSIM进行细化以匹配人类感知。首先通过Mask R-CNN隔离只有时间上新颖的对象,然后通过层次交叉注意力引导扩散更新到对象和全局上下文中,最后将每个像素分类为C种变化类型之一,我们的方法提供了详细且可解释的多类别地图。在合成基准和实际基准上,该方法在F1和IoU指标上优于传统的差异计算、Siamese CNN以及基于GAN的检测器,达到了10-25分的改进,标志着遥感变化检测的新突破。