LLM2D

摘要

arXiv:2502.14996v1 公告类型: cross 摘要：衡量面部识别（FR）系统的准确性对于提高性能和确保负责任地使用该技术至关重要。准确性通常通过大型标注数据集进行估算，但这些数据集成本高且难以获得。我们提出了一种新颖的1:1面部验证方法，可以在无需手动标注的情况下快速评估FR系统，从近似标签（例如来自网络搜索结果）开始。不同于之前用于训练集标签清理的方法，我们利用了被评估模型的嵌入表示，实现了在较小测试数据集上的高准确性。我们的方法可靠地估计了FR的准确性和排名，显著降低了手动标注所需的时间和成本。我们还介绍了首个公开发布的五种FR云服务基准测试，揭示了人口统计学上的偏见，尤其是亚裔女性的准确性较低。我们的快速测试方法可以将FR测试民主化，促进对该技术的审查和负责任地使用。我们的方法已作为可公开访问的工具提供在 https://github.com/caltechvisionlab/frt-rapid-test