LLM2D

摘要

arXiv:2503.23275v1 交叉公告类型摘要：耳纹识别由于成年后外观相对稳定，已 emerges 作为一种有前途的生物识别模ality。尽管视觉变换器（ViTs）在图像识别任务中得到了广泛应用，但在耳纹识别中的效率受到关注不足的像素块的限制，这对于捕捉精细的耳纹特征至关重要。在本研究中，我们使用重叠像素块选择策略，在OPIB、AWE、WPUT和EarVN1.0等多样化的数据集上评估了ViT-Tiny（ViT-T）、ViT-Small（ViT-S）、ViT-Base（ViT-B）和ViT-Large（ViT-L）配置。结果表明，重叠像素块的关键性，使其在48项中有44项实验中表现出色。此外，与非重叠配置的结果相比，重叠像素块的性能提高显著， EarVN1.0 数据集的提升幅度高达10%。在模型性能方面，ViT-T 模型在 AWE、WPUT 和 EarVN1.0 数据集上始终优于 ViT-S、ViT-B 和 ViT-L 模型。最高分是在 28x28 像素大小和 14 像素步幅的配置中取得的。这种像素大小-步幅配置代表了标准化图像区域的 25%（112x112 像素），对于像素大小来说，步幅占行或列大小的 12.5%。本研究表明，具有重叠像素块选择的变换器架构可以作为在验证场景中进行耳纹为基础的生物识别任务的有效且高效率的选项。