摘要
arXiv:2502.14996v1 公告类型: cross
摘要:衡量面部识别(FR)系统的准确性对于提高性能和确保负责任地使用该技术至关重要。准确性通常通过大型标注数据集进行估算,但这些数据集成本高且难以获得。我们提出了一种新颖的1:1面部验证方法,可以在无需手动标注的情况下快速评估FR系统,从近似标签(例如来自网络搜索结果)开始。不同于之前用于训练集标签清理的方法,我们利用了被评估模型的嵌入表示,实现了在较小测试数据集上的高准确性。我们的方法可靠地估计了FR的准确性和排名,显著降低了手动标注所需的时间和成本。我们还介绍了首个公开发布的五种FR云服务基准测试,揭示了人口统计学上的偏见,尤其是亚裔女性的准确性较低。我们的快速测试方法可以将FR测试民主化,促进对该技术的审查和负责任地使用。我们的方法已作为可公开访问的工具提供在 https://github.com/caltechvisionlab/frt-rapid-test