LLM2D
内部评估不够充分:通往稳健的第三方漏洞披露之路(针对通用人工智能)
In-House Evaluation Is Not Enough: Towards Robust Third-Party Flaw Disclosure for General-Purpose AI
作者: Shayne Longpre, Kevin Klyman, Ruth E. Appel, Sayash Kapoor, Rishi Bommasani, Michelle Sahar, Sean McGregor, Avijit Ghosh, Borhane Blili-Hamelin, Nathan Butters, Alondra Nelson, Amit Elazari, Andrew Sellars, Casey John Ellis, Dane Sherrets, Dawn Song, Harley Geiger, Ilona Cohen, Lauren McIlvenny, Madhulika Srikumar, Mark M. Jaycox, Markus Anderljung, Nadine Farid Johnson, Nicholas Carlini, Nicolas Miailhe, Nik Marda, Peter Henderson, Rebecca S. Portnoff, Rebecca Weiss, Victoria Westerhoff, Yacine Jernite, Rumman Chowdhury, Percy Liang, Arvind Narayanan
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.16861v2

摘要

arXiv:2503.16861v2 宣布类型: 替换 摘要:通用人工智能(GPAI)系统的广泛应用带来了重大的新风险。然而,关于报告GPAI系统缺陷的基础设施、实践和规范仍严重缺失,大大落后于软件安全等更成熟的领域。基于来自软件安全、机器学习、法律、社会科学和政策等多个领域的专家合作,我们识别了评估和报告GPAI系统缺陷的关键缺口。我们呼吁采取三项干预措施以推进系统安全性。首先,我们提议研究者使用标准的AI缺陷报告和交流规则,以便于提交、复现和处理GPAI系统的缺陷。其次,我们建议GPAI系统提供商采用范围广泛的缺陷披露计划,借鉴漏洞赏金的方式,并提供法律庇护以保护研究人员。第三,我们主张开发改进的基础设施,以协调分布缺陷报告给众多可能受到影响的利益相关者。这些干预措施随着不同提供商的GPAI系统中普遍存在逃逸和其它缺陷现象变得越来越紧迫。通过在AI生态系统中促进稳健的报告和协调,这些提案有望显著提高GPAI系统的安全性、安全性和问责制。