摘要
arXiv:2501.06235v2 Announce Type: replace-cross
摘要:4D全景LiDAR分割对于自动驾驶和机器人领域的场景理解至关重要,它结合了语义分割和实例分割,并具备时序一致性。当前方法,如4D-PLS和4D-STOP,采用检测跟踪的方法,利用深度学习网络对每帧进行语义和实例分割。为了保持时序一致性,当前帧中检测到的大规模实例会与包含当前帧和前一帧的时序窗口中存在的实例进行比较和关联。然而,这些方法依赖于短期实例检测、缺乏运动估计,并且排除了小型实例,导致频繁的身份切换和跟踪性能降低。我们通过NextStop1追踪器解决了这些问题,该追踪器集成了基于卡尔曼滤波的运动估计、数据关联和生命周期管理,并引入了追踪片段状态的概念以改善优先级。在使用LiDAR分割和追踪质量(LSTQ)度量标准对SemanticKITTI验证集进行评估时,NextStop在小型对象(如行人和骑自行车的人)的跟踪性能方面表现更佳,身份切换减少,跟踪初始化提前,并且在复杂环境中的可靠性提高。源代码可在https://github.com/AIROTAU/NextStop获取。