LLM2D

摘要

arXiv:2412.09044v2 发布类型: replace-cross 摘要：通过3D骨架数据进行行人重新识别（re-ID）是一项在许多应用场景中具有重要价值但极具挑战性的任务。现有的基于骨架的方法通常假设所有关节之间的虚拟运动关系，并采用均值关节或序列表示进行学习。然而，它们很少探索关键的躯体结构和运动，如步态，以关注更重要的关节或肢体，缺乏充分挖掘骨架的时空子模式的能力，以增强模型学习。本文提出了一种通用的由动机引导的图变换器MoCoS，该变换器利用特定结构和步态相关的身体关系以及骨架图的组合特征，学习有效的骨架表示以进行行人重新识别。具体而言，受到关节结构中的局部性和步态中身体组件协作的启发，我们首先提出了一种动机引导的图变换器（MGT），它结合了分层结构动机和步态协作动机，同时关注多阶局部关节相关性和关键协同身体部分，以增强骨架关系学习。然后，我们设计了组合骨架原型学习（CSP），利用关节节点和骨架图的空间-时间随机组合生成多样性的子骨架和子片段表示，这些表示被与每个身份最具代表性的特征（原型）进行对比，以学习类别相关的语义和判别性骨架表示。广泛的实验验证了MoCoS在现有先进技术模型中的优越性能。我们进一步展示了MoCoS在RGB估计的骨架、不同的图建模以及无监督场景下的通用性。