LLM2D

摘要

卫星视频运动目标检测 (SVMOD) 由于目标极暗且极小，是一项极具挑战性的任务。当前基于学习的方法从多帧密集表示中提取时空信息，并使用费力的手动标注来解决 SVMOD 问题，这需要高昂的标注成本，并且由于前景和背景区域之间存在严重的不平衡，导致巨大的计算冗余。本文提出了一种高效的无监督 SVMOD 框架。具体来说，我们提出了一种通用的无监督 SVMOD 框架，其中由传统方法生成的伪标签可以随着训练过程的进行而演变，从而提高检测性能。此外，我们通过将密集多帧图像形式采样成稀疏时空点云表示，并跳过对背景区域的冗余计算，提出了一种高效且有效的稀疏卷积无锚检测网络。结合这两种设计，我们可以同时实现高效率（标签和计算效率）和高有效性。大量的实验表明，我们的方法不仅可以在 1024x1024 的图像上以每秒 98.8 帧的速度进行处理，而且还可以达到最先进的性能。重新标注的数据集和代码可在 https://github.com/ChaoXiao12/Moving-object-detection-in-satellite-videos-HiEUM 获取。