LLM2D
Saga:从大量未标注的IMU数据中捕获多粒度语义以用户感知为准绳
Saga: Capturing Multi-granularity Semantics from Massive Unlabelled IMU Data for User Perception
作者: Yunzhe Li, Facheng Hu, Hongzi Zhu, Shifan Zhang, Liang Zhang, Shan Chang, Minyi Guo
发布日期: 4/17/2025
arXiv ID: oai:arXiv.org:2504.11726v1

摘要

arXiv:2504.11726v1 宣告类型: cross 摘要: 动态测量单元(IMUs)已在活动识别和用户认证等多种移动感知应用中普遍使用,通常需要大量标注数据来训练一个令人满意的模型。然而,由于难以理解原始IMU数据和缺乏真实标签,大规模IMU数据中的微活动标注非常困难。在本文中,我们提出了一种新的细粒度用户感知方法,称为Saga,该方法仅需少量标注的IMU数据即可实现令人惊叹的用户感知准确性。Saga的核心思想是首先利用大量未标注的IMU数据中嵌入的不同层次的丰富语义信息来预训练一个骨干特征提取模型。同时,对于特定的下游用户感知应用,使用贝叶斯优化来确定预训练任务中涉及不同语义层次的最优权重。我们在五种典型的移动电话上实现了Saga,并在三个典型的任务上使用三个IMU数据集评估了Saga。结果显示,在每类仅使用约100个训练样本的情况下,Saga可以达到超过有超过数万个训练样本的完整模型90%以上的准确率,而无需额外的系统开销。