摘要
arXiv:2504.16110v1 安全类型:跨域
摘要:关于人工智能(AI)的讨论通常集中在安全、透明度、问责制、对齐和责任等方面。然而,人工智能安全(即保护数据、模型和管道免受恶意操纵)是所有这些努力的基础。本文建议必须将人工智能安全作为基础层面予以优先考虑。我们提出了一个分层的人工智能挑战视角,区分安全与安全,主张采取以安全优先的方法,以促进可信赖和韧性的人工智能系统。我们讨论了核心威胁模型、关键攻击向量以及新兴的防御机制,结论认为,以度量驱动的方法对于实现稳健的人工智能安全、透明度和问责制是必不可少的。