LLM2D
卫星视频中高效无监督运动目标检测框架
Highly Efficient and Unsupervised Framework for Moving Object Detection in Satellite Videos
作者: C. Xiao, W. An, Y. Zhang, Z. Su, M. Li, W. Sheng, M. Pietik\"ainen, L. Liu
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15895v1

摘要

卫星视频运动目标检测 (SVMOD) 由于目标极暗且极小,是一项极具挑战性的任务。当前基于学习的方法从多帧密集表示中提取时空信息,并使用费力的手动标注来解决 SVMOD 问题,这需要高昂的标注成本,并且由于前景和背景区域之间存在严重的不平衡,导致巨大的计算冗余。本文提出了一种高效的无监督 SVMOD 框架。具体来说,我们提出了一种通用的无监督 SVMOD 框架,其中由传统方法生成的伪标签可以随着训练过程的进行而演变,从而提高检测性能。此外,我们通过将密集多帧图像形式采样成稀疏时空点云表示,并跳过对背景区域的冗余计算,提出了一种高效且有效的稀疏卷积无锚检测网络。结合这两种设计,我们可以同时实现高效率(标签和计算效率)和高有效性。大量的实验表明,我们的方法不仅可以在 1024x1024 的图像上以每秒 98.8 帧的速度进行处理,而且还可以达到最先进的性能。重新标注的数据集和代码可在 https://github.com/ChaoXiao12/Moving-object-detection-in-satellite-videos-HiEUM 获取。