LLM2D

摘要

arXiv:2412.02479v2 通告类型: 替换-交叉摘要：随着深度学习的发展，面部识别技术的研究和快速发展也引起了广泛关注。尽管面部识别技术被认为是成熟的技术，但我们发现现有的开源模型和商用算法在某些复杂的离域（OOD）场景中缺乏稳健性，这引起了对这些系统可靠性的担忧。在本文中，我们介绍了OODFace，从两个视角探讨了面部识别模型面临的OOD挑战：常见的破坏和外观变化。我们系统地设计了30个面向面部识别的离域场景，涵盖了9个主要类别。通过在公共数据集上模拟这些挑战，我们建立了三个稳健性基准：LFW-C/V、CFP-FP-C/V 和 YTF-C/V。然后，我们在19个面部识别模型和3个商用API，以及扩展的物理实验，包括面罩评估方面，进行了广泛的实验，以评估其稳健性。接下来，我们从两个角度探讨潜在的解决方案：防御策略和视觉-语言模型（VLMs）。根据实验结果，我们得出了一些关键见解，强调了面部识别系统的脆弱性，以及可能的解决方案。此外，我们提供了一个统一的工具包，其中包括所有类型的破坏和变化，且易于扩展到其他数据集。我们希望我们的基准和发现能够为未来面部识别模型稳健性的改进提供指导。