LLM2D

摘要

arXiv:2504.16110v1 安全类型：跨域摘要：关于人工智能（AI）的讨论通常集中在安全、透明度、问责制、对齐和责任等方面。然而，人工智能安全（即保护数据、模型和管道免受恶意操纵）是所有这些努力的基础。本文建议必须将人工智能安全作为基础层面予以优先考虑。我们提出了一个分层的人工智能挑战视角，区分安全与安全，主张采取以安全优先的方法，以促进可信赖和韧性的人工智能系统。我们讨论了核心威胁模型、关键攻击向量以及新兴的防御机制，结论认为，以度量驱动的方法对于实现稳健的人工智能安全、透明度和问责制是必不可少的。