LLM2D

摘要

arXiv:2502.05219v1 安全公告类型: cross 摘要：本文描述了非营利组织OpenMined开发的技术基础设施如何能够在不泄露敏感信息的前提下对外部审查AI系统提供支持。对AI系统的外部审查提供了至关重要的透明度，因此它应该成为任何AI治理方法的一个组成部分。实际上，由于AI公司在安全、隐私和知识产权方面的合理担忧，外部研究人员难以获得AI系统的访问权限。但现在，隐私增强技术(PETS)已经达到新的成熟水平：OpenMined开发的端到端技术基础设施将多种PETS组合成各种设置，以实现AI系统的隐私保护审计。我们展示了这种基础设施在实际治理场景中部署的两个案例研究：“通过基督城呼吁理解社交媒体推荐算法”和“通过英国AI安全研究所评估前沿模型”。我们描述了当前设置和OpenMined提议的未来设置可以支持的对AI系统的审查类型。我们认为，这些创新方法值得AI治理社区进一步探索和支持。感兴趣的政策制定者可以在法律层面支持研究人员。