摘要
arXiv:2504.17696v2 宣告类型: replace-cross
摘要:Daily Activity Recordings for Artificial Intelligence(DARai,发音为“Dahr-ree”)是一个多模态、分层注释的数据集,旨在理解现实环境中的人类活动。DARai 包含50名参与者的10个不同环境中的连续编排和非编排的活动记录,总共收集了超过200小时的数据,包括多个摄像头视角、深度和雷达传感器、可穿戴惯性测量单元(IMU)、肌电图(EMG)、足底压力传感器、生物监测传感器以及眼动追踪器的数据。
为了捕捉人类活动的复杂性,DARai 在三个层次上进行了注释:(i) 高级活动(L1)是独立的任务,(ii) 低级动作(L2)是不同活动之间共享的模式,(iii) 细粒度的操作(L3)详细描述了动作的精确执行步骤。数据集的注释和记录设计使得22.7%的L2 动作在L1 活动之间共享,14.2%的L3 操作在L2 动作之间共享。DARai 的重叠性和非编排特性允许数据集中存在反事实活动。
使用各种机器学习模型的实验展示了DARai 在揭示以人类为中心的应用中的重要挑战方面的价值。具体而言,我们在所有层次的注释级别上进行了单一模态和多模态传感器数据融合的实验,以识别、时间局部化和预测未来行动。为了突出单个传感器的限制,我们还进行了由DARai 的多传感器和反事实活动设计设置所启用的领域变体实验。
相关的代码、文档和数据集可以在专门的DARai 网站上获得:https://alregib.ece.gatech.edu/software-and-datasets/darai-daily-activity-recordings-for-artificial-intelligence-and-machine-learning/