摘要
卫星视频运动目标检测 (SVMOD) 由于目标极暗且极小,是一项极具挑战性的任务。当前基于学习的方法从多帧密集表示中提取时空信息,并使用费力的手动标注来解决 SVMOD 问题,这需要高昂的标注成本,并且由于前景和背景区域之间存在严重的不平衡,导致巨大的计算冗余。本文提出了一种高效的无监督 SVMOD 框架。具体来说,我们提出了一种通用的无监督 SVMOD 框架,其中由传统方法生成的伪标签可以随着训练过程的进行而演变,从而提高检测性能。此外,我们通过将密集多帧图像形式采样成稀疏时空点云表示,并跳过对背景区域的冗余计算,提出了一种高效且有效的稀疏卷积无锚检测网络。结合这两种设计,我们可以同时实现高效率(标签和计算效率)和高有效性。大量的实验表明,我们的方法不仅可以在 1024x1024 的图像上以每秒 98.8 帧的速度进行处理,而且还可以达到最先进的性能。重新标注的数据集和代码可在 https://github.com/ChaoXiao12/Moving-object-detection-in-satellite-videos-HiEUM 获取。