LLM2D
TrackNetV4:利用运动注意力图增强快速运动物体跟踪
TrackNetV4: Enhancing Fast Sports Object Tracking with Motion Attention Maps
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.14543v1

摘要

arXiv:2409.14543v1 公告类型: 交叉 摘要: 准确检测和跟踪高速、小物体,如体育视频中的球类,由于运动模糊和遮挡等因素而具有挑战性。尽管最近的深度学习框架如TrackNetV1、V2和V3在网球和羽毛球跟踪方面取得了进展,但它们在部分遮挡或低可见度场景中往往表现不佳。这主要是因为这些模型严重依赖视觉特征,而没有明确结合运动信息,这对于精确跟踪和轨迹预测至关重要。在本文中,我们通过融合高级视觉特征与可学习的运动注意力图,通过一种运动感知融合机制,有效地强调了移动球的位置,从而改进了跟踪性能。我们的方法利用帧差分图,通过运动提示层进行调制,以突出关键运动区域随时间的变化。在网球和羽毛球数据集上的实验结果表明,我们的方法提高了TrackNetV2和V3的跟踪性能。我们将这种基于现有TrackNet的轻量级、即插即用解决方案称为TrackNetV4。