LLM2D
基于自回归变换的图像对齐
Auto-regressive transformation for image alignment
作者: Kanggeon Lee, Soochahn Lee, Kyoung Mu Lee
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2505.04864v1

摘要

arXiv:2505.04864v1 归一化类型: cross 摘要:现有图像对齐方法在特征稀疏区域、极端尺度和视场差异以及大形变情况下表现不佳,常常导致准确性不足。通过在多尺度图像表示中关注关键区域并逐步细化变换场,可以提高对这些挑战的鲁棒性。因此,我们提出了一种名为自回归变换(ART)的新方法,该方法在自回归框架中迭代估计从粗到细的变换。利用分层多尺度特征,我们的网络在每个尺度上使用随机采样的点来细化变换。通过结合跨注意力层的指导,模型能够关注关键区域,即使在特征受限的挑战性条件下也能确保精确对齐。在多种数据集上的广泛实验表明,ART 显著优于现有最佳方法,使其成为一种广泛适用的精确图像对齐的新方法。