LLM2D
用于三维形状重组的几何点注意力Transformer
Geometric Point Attention Transformer for 3D Shape Reassembly
作者: Jiahan Li, Chaoran Cheng, Jianzhu Ma, Ge Liu
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.17788v1

摘要

形状组装,其目标是将分离的部件重新组装成完整的物体,近年来受到了广泛关注。现有方法主要依赖于网络来预测各个部件的姿态,但往往无法有效捕捉部件之间及其姿态的几何相互作用。本文提出了一种名为几何点注意力变换器(GPAT)的网络,专门用于解决几何关系推理的挑战。在几何点注意力模块中,我们整合了全局形状信息和局部成对几何特征,以及表示为每个部件的旋转和平移向量的姿态。为了实现迭代更新和动态推理,我们引入了一种几何循环方案,其中每个预测都被送入下一轮迭代进行细化。我们在语义和几何组装任务上对我们的模型进行了评估,结果表明,它在绝对姿态估计方面优于以往的方法,实现了精确的姿态预测和较高的对齐精度。