摘要
arXiv:2504.21415v1 Announce Type: cross
摘要:用户身份验证是确保计算机系统安全访问的关键,但传统方法在易用性、成本和安全性方面存在局限性。基于对用户与鼠标设备自然交互行为分析的鼠标动态身份验证提供了一种成本效益高、非侵入性和适应性强的解决方案。然而,在确定所需数据量、平衡准确性和实用性,以及有效捕捉时间行为模式方面仍存在挑战。在此研究中,我们提出了一种基于高斯核密度估计(KDE)和Kullback-Leibler(KL)散度的统计方法来估计训练身份验证模型所需的充分数据量。我们引入了鼠标认证单元(MAU),利用近似熵(ApEn)来优化段长,以实现高效且准确的行为表征。此外,我们设计了局部时间鼠标认证(LT-AMouse)框架,集成了1D-ResNet进行局部特征提取和GRU用于建模长期时间依赖关系。以Balabit和DFL数据集为例,我们显著减少了数据规模,DFL数据集特别减少了10倍的数据量,极大地减轻了训练负担。此外,我们根据近似熵的斜率在不同的数据集中确定了用户身份认证系统的最优输入识别单元长度。使用不平衡样本进行训练,我们的模型在DFL数据集上的盲目攻击防御AUC为98.52%,在Balabit数据集上为94.65%,超过了当前的SOTA性能。