LLM2D
基于变压器的分配决策网络用于多对象跟踪
Transformer-based assignment decision network for multiple object tracking
作者: Athena Psalta, Vasileios Tsironis, Konstantinos Karantzalos
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2208.03571v3

摘要

arXiv:2208.03571v3 宣告类型: replace-cross 摘要:数据关联是任何遵循检测跟踪范式的多对象跟踪(MOT)方法中的一个关键组成部分。为了生成完整的轨迹,这类方法在每个时间步长中使用数据关联过程来建立检测和现有目标之间的分配。近期的数据关联方法试图解决多维线性分配任务,或网络流最小化问题,或者通过多假设跟踪来解决这个问题。然而,在推理过程中,对于每一帧序列,都需要一个优化步骤来计算最优分配,这增加了任何给定解决方案的复杂性。为此,在本研究的背景下,我们引入了基于Transformer的数据分配决策网络(TADN),该网络在推理过程中不需要显式的优化过程来处理数据关联问题。特别是,TADN可以直接在一个网络的前向传播过程中推断检测和活跃目标之间的分配对。我们已经在相对简单的MOT框架中集成了TADN,并设计了一种新的训练策略,用于高效的端到端训练,并在几个流行的基准测试上,即MOT17、MOT20和UA-DETRAC,展示了我们方法在在线视觉跟踪-检测MOT方面的高潜力。我们提出的方法在大多数评估指标中表现出强大的性能,尽管其作为一种缺乏显著辅助组件(如遮挡处理或再识别)的简单跟踪器。我们的方法的实现已公开发布在 https://github.com/psaltaath/tadn-mot。