摘要
arXiv:2503.11917v3 宣布类型: replace-cross
摘要:随着前沿AI模型的能力不断增强,评估它们可能用于发动网络攻击的可能性对于确保人工智能通用智能(AGI)的安全发展至关重要。当前的网络评估努力往往缺乏系统性地分析攻击阶段,并且缺乏针对目标防御的指导。本项工作引入了一种新的评估框架,通过以下方式解决了这些限制:(1)检查端到端的攻击链,(2)识别AI威胁评估中的不足之处,以及(3)帮助防御者优先考虑有针对性的缓解措施,并利用AI进行对手模拟以进行红队演练。我们的方法将现有的网络攻击链框架适应于AI系统。我们分析了谷歌威胁情报组编目超过12,000个AI参与的网络安全事件实例,从中筛选出七个有代表性的攻击链模式。通过对这些模式进行瓶颈分析,我们指出了最容易受到AI驱动干扰的阶段。然后我们确定并利用针对这些关键阶段的外部开发的网络安全模型评估。我们报告了AI在其特定攻击阶段放大进攻能力的潜力,并提出了优先防御的建议。我们认为,这代表了迄今为止发布的最全面的AI网络安全风险评估框架。