LLM2D

摘要

arXiv:2502.14491v1 安全类型：新摘要：评估AI安全性需要严格的方法和风险指标，以理解AI的应用如何影响整体风险。然而，许多AI安全文献主要集中于AI模型本身的潜在风险，而忽视了模块化使用AI如何影响工作流组件的风险分配或整体风险指标。此外，在缺乏统计基础的情况下，也难以使风险模型在有无AI的情况下敏感化，以估算AI的因果贡献。这在一定程度上是由于缺乏可用于拟合分布的AI影响数据。在本工作中，我们从两方面解决了这些问题。首先，我们展示了如何通过情景建模（基于现有的统计技术如马尔可夫链、 copulas 和蒙特卡洛模拟）来全面建模AI风险。其次，我们展示了如何使用类似AI现象的替代分布来估计在无法直接观察数据的情况下AI的影响。我们通过风险分析模拟物流情景来验证我们方法对于基准累计AI风险的实用性。