LLM2D

摘要

arXiv:2503.18673v2 宣告类型: replace-cross 摘要：我们引入了Any6D，这是一种无需基于模型的6D物体姿态估计框架，仅需一个单RGB-D锚图像即可估计未知物体在新场景中的6D姿态和大小。与现有方法依赖于纹理化的3D模型或多视图不同，Any6D利用联合物体对齐过程来增强2D-3D对齐和尺度估计，从而提高姿态准确性。我们的方法整合了渲染-比较策略来生成和细化姿态假设，使在遮挡、非重叠视角、多种照明条件和大量跨环境变化场景中表现出更高的鲁棒性。我们使用五个具有挑战性的数据集：REAL275、Toyota-Light、HO3D、YCBINEOAT 和 LM-O 对该方法进行了评估，证明了其在新物体姿态估计方面显著优于现有最先进的方法的有效性。项目页面：https://taeyeop.com/any6d