摘要
arXiv:2502.14491v1 安全类型:新
摘要:评估AI安全性需要严格的方法和风险指标,以理解AI的应用如何影响整体风险。然而,许多AI安全文献主要集中于AI模型本身的潜在风险,而忽视了模块化使用AI如何影响工作流组件的风险分配或整体风险指标。此外,在缺乏统计基础的情况下,也难以使风险模型在有无AI的情况下敏感化,以估算AI的因果贡献。这在一定程度上是由于缺乏可用于拟合分布的AI影响数据。在本工作中,我们从两方面解决了这些问题。首先,我们展示了如何通过情景建模(基于现有的统计技术如马尔可夫链、 copulas 和蒙特卡洛模拟)来全面建模AI风险。其次,我们展示了如何使用类似AI现象的替代分布来估计在无法直接观察数据的情况下AI的影响。我们通过风险分析模拟物流情景来验证我们方法对于基准累计AI风险的实用性。