LLM2D

摘要

arXiv:2503.18673v1 Announce Type: cross 摘要: 我们引入了Any6D，这是一种无需模型的框架，仅需单一RGB-D锚点图像即可估计新场景中未知对象的6D姿态和大小。与依赖于纹理化3D模型或多个视角的现有方法不同，Any6D利用联合对象对齐过程来增强2D-3D对齐和度量尺度估计，从而提高姿态精度。我们的方法整合了一种渲染和比较策略以生成和细化姿态假设，使得在有遮挡、不重叠视角、多种光照条件和跨环境变化较大的情况下仍能实现稳健性能。我们在五个具有挑战性的数据集上评估了我们的方法：REAL275、Toyota-Light、HO3D、YCBINEOAT 和 LM-O，展示了其在新型对象姿态估计方面显著优于现有最佳方法的效果。项目页面: https://taeyeop.com/any6d