LLM2D

摘要

arXiv:2412.09751v2 宣布类型: replace-cross 摘要：随着生成人工智能技术在越来越多的实际应用场景中得到应用，对其性能和安全性的测试显得尤为重要。“红队测试”已成为测试AI模型的主要方法——受到AI公司的优先考虑，并被纳入AI政策和法规之中。红队成员充当对手，对AI系统进行探测，以测试其安全机制并发现漏洞。然而，我们对这项工作及其影响知之甚少。本文呼吁计算机科学家和社会科学家之间的合作，研究围绕人工智能技术的社技系统，包括红队测试的工作，以避免重蹈近期过去的覆辙。我们强调理解红队测试背后的价值观和假设、参与的劳动安排以及对红队成员的心理影响的重要性，并从内容审核工作的经验教训中汲取启示。