LLM2D
基于事件相机的人眼瞳孔追踪框架
A Framework for Pupil Tracking with Event Cameras
作者: Khadija Iddrisu, Waseem Shariff, Suzanne Little
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2407.16665v2

摘要

眼跳是双眼同时发生的极快运动,通常发生在个体将注意力从一个物体转移到另一个物体时。这些运动是人类产生的最快的运动之一,并且有可能达到比眨眼速度更快的速度。在眼跳过程中,眼睛的峰值角速度在人类中可以高达 700 度/秒,尤其是在覆盖 25 度视角的较大型眼跳中。先前的研究表明,通过对眼跳的研究,在理解神经系统疾病方面取得了令人鼓舞的结果。眼跳检测中一个必要的步骤是准确识别眼球中瞳孔的精确位置,从该位置可以推断出诸如注视角度等其他信息。传统的基于帧的相机通常难以实现跟踪非常快速运动所需的较高时间精度,从而导致运动模糊和延迟问题。另一方面,事件相机提供了一种很有希望的替代方案,通过异步记录视觉场景的变化,提供高时间分辨率和低延迟。通过弥合传统计算机视觉和基于事件的视觉之间的差距,我们将事件表示为帧,这些帧可以被标准深度学习算法轻松利用。这种方法利用 YOLOv8(一种最先进的目标检测技术)来处理这些帧,以使用公开可用的 Ev-Eye 数据集进行瞳孔跟踪。实验结果证明了该框架的有效性,突出了其在神经科学、眼科和人机交互方面的潜在应用。