LLM2D

摘要

arXiv:2505.06380v1 Announce Type: 隐藏摘要：随着人工智能（AI）系统在各个领域的广泛应用，对稳健的、积极主动的安全策略的需求变得至关重要。传统防御措施往往无法应对推动AI技术发展的独特且不断演变的威胁，因此，积极的安全策略成为识别和缓解风险必不可少的方法。本文提出了一种全面的AI系统积极安全框架，强调积极威胁模拟和对抗性测试，以在整个AI生命周期中发现漏洞。我们探讨了关键的积极安全技术，包括缺陷和漏洞评估、渗透测试和红队演练，这些技术是针对AI的独特脆弱性专门设计的。通过模拟实际攻击场景，这些方法论揭示出关键见解，为制定更强大的防御策略提供依据，并推动对新兴威胁的抗打击能力的提升。该框架将积极的AI安全从理论概念推进到可操作的实际方法论，这些方法论有助于组织增强其AI系统对新兴威胁的抵抗力。