LLM2D
第一人称视角视觉的挑战与趋势:一个综述
Challenges and Trends in Egocentric Vision: A Survey
作者: Xiang Li, Heqian Qiu, Lanxiao Wang, Hanwen Zhang, Chenghao Qi, Linfeng Han, Huiyu Xiong, Hongliang Li
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2503.15275v2

摘要

arXiv:2503.15275v2 通知类型: 交叉替换 摘要:随着人工智能技术与可穿戴设备的迅速发展,自视点视觉理解已成为一个新的且具有挑战性的研究方向,并逐渐吸引了学术界和工业界的广泛关注。自视点视觉通过人体佩戴的摄像机或传感器捕捉视觉和多模态数据,提供了一种模拟人类视觉体验的独特视角。本文全面介绍了自视点视觉理解的研究,系统分析了自视点场景的组成部分,并将任务划分为四大类:主体理解、物体理解、环境理解以及混合理解。我们详细探讨了每个类别内的子任务。我们还总结了当前领域存在的主要挑战和趋势。此外,本文概述了高质量的自视点视觉数据集,为未来的研究提供了宝贵资源。通过总结最新的进步,我们展望了自视点视觉技术在增强现实、虚拟现实和实体智能等领域中的广泛应用,并基于最新的领域发展提出了未来的研究方向。