摘要
arXiv:2412.09751v2 宣布类型: replace-cross
摘要:随着生成人工智能技术在越来越多的实际应用场景中得到应用,对其性能和安全性的测试显得尤为重要。“红队测试”已成为测试AI模型的主要方法——受到AI公司的优先考虑,并被纳入AI政策和法规之中。红队成员充当对手,对AI系统进行探测,以测试其安全机制并发现漏洞。然而,我们对这项工作及其影响知之甚少。本文呼吁计算机科学家和社会科学家之间的合作,研究围绕人工智能技术的社技系统,包括红队测试的工作,以避免重蹈近期过去的覆辙。我们强调理解红队测试背后的价值观和假设、参与的劳动安排以及对红队成员的心理影响的重要性,并从内容审核工作的经验教训中汲取启示。