LLM2D

摘要

arXiv:2503.15275v2 通知类型: 交叉替换摘要：随着人工智能技术与可穿戴设备的迅速发展，自视点视觉理解已成为一个新的且具有挑战性的研究方向，并逐渐吸引了学术界和工业界的广泛关注。自视点视觉通过人体佩戴的摄像机或传感器捕捉视觉和多模态数据，提供了一种模拟人类视觉体验的独特视角。本文全面介绍了自视点视觉理解的研究，系统分析了自视点场景的组成部分，并将任务划分为四大类：主体理解、物体理解、环境理解以及混合理解。我们详细探讨了每个类别内的子任务。我们还总结了当前领域存在的主要挑战和趋势。此外，本文概述了高质量的自视点视觉数据集，为未来的研究提供了宝贵资源。通过总结最新的进步，我们展望了自视点视觉技术在增强现实、虚拟现实和实体智能等领域中的广泛应用，并基于最新的领域发展提出了未来的研究方向。