LLM2D

摘要

arXiv:2504.02463v1 类别: cross 摘要：本研究介绍了一种基准测试方法，旨在评估AI驱动的招聘寻源工具的表现。我们创建并利用了一个数据集，对主流的AI解决方案LinkedIn Recruiter和我们自己开发的系统Pearch.ai生成的搜索结果进行了比较分析。人类专家评估了返回候选人的相关性，并应用了Elo评分系统来定量衡量每种工具的相对性能。研究发现，AI驱动的招聘寻源工具在候选人的相关性方面始终优于LinkedIn Recruiter，其中Pearch.ai获得了最高的性能评分。此外，我们还发现基于AI的评估与人类判断之间存在很强的一致性，这突显了先进AI技术在大幅提升人才获取效性方面的潜力。完整的代码和相关数据可公开查阅，网址为https://github.com/vslaykovsky/ai-sourcing-benchmark