LLM2D

摘要

arXiv:2501.18669v1 透明度类型：交叉摘要：来自监管者、研究人员和用户等各个利益相关方对AI系统的透明度要求正在日益增多且紧迫，相比之下，开发AI的公司相对较少。对于AI的透明度概念众多，每个概念都关注不同的利益和关切。在计算机安全领域，透明度也被视为一个关键概念。安全社区长期以来一直抵制所谓的“安全即隐蔽”——即认为隐藏系统的工作原理可以防止攻击的观点——这种观点受到了行业及其他利益相关方的巨大压力。几十年来，在一个不完美且不断进行的社区过程中，安全研究人员和实践者逐渐建立了一些关于如何平衡透明度利益与潜在的负面副作用的规范和实践。本文提出一个问题：AI社区可以从安全社区在透明度方面的经验中学到什么？我们识别了安全社区在透明度益处及如何平衡透明度与反向利益方面的三个关键主题。针对每个主题，我们探讨了与AI的透明度相关的平行和见解。然后，我们提供了有关透明度如何影响匿名化这一研究子领域的案例研究讨论。最后，从相似之处转向差异之处，我们突出了现代AI系统所面临的与其它类型的安全关键系统不同的透明度问题，从安全和AI社区共同提出了一些有趣的研究问题。