LLM2D
评估AI招聘 sourcing 工具的人类偏好
Evaluating AI Recruitment Sourcing Tools by Human Preference
作者: Vladimir Slaykovskiy, Maksim Zvegintsev, Yury Sakhonchyk, Hrachik Ajamian
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2504.02463v1

摘要

arXiv:2504.02463v1 类别: cross 摘要:本研究介绍了一种基准测试方法,旨在评估AI驱动的招聘寻源工具的表现。我们创建并利用了一个数据集,对主流的AI解决方案LinkedIn Recruiter和我们自己开发的系统Pearch.ai生成的搜索结果进行了比较分析。人类专家评估了返回候选人的相关性,并应用了Elo评分系统来定量衡量每种工具的相对性能。研究发现,AI驱动的招聘寻源工具在候选人的相关性方面始终优于LinkedIn Recruiter,其中Pearch.ai获得了最高的性能评分。此外,我们还发现基于AI的评估与人类判断之间存在很强的一致性,这突显了先进AI技术在大幅提升人才获取效性方面的潜力。完整的代码和相关数据可公开查阅,网址为https://github.com/vslaykovsky/ai-sourcing-benchmark