LLM2D
阈值穿越作为 Catastrophic AI 风险的尾事件
Threshold Crossings as Tail Events for Catastrophic AI Risk
作者: Elija Perrier
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.18979v1

摘要

arXiv:2503.18979v1 类型: cross 摘要: 我们分析了导致AI系统在出现极端结果分布的情况下通过分支驱动跳跃的情形。通过分析控制参数在灾难性阈值附近的随机波动如何产生极端结果,我们展示了在何种情况下突然的、大型的转换概率与最终损害分布的尾部概率密切相关。我们的研究成果有助于在试图管理潜在灾难性AI风险时监测、缓解和控制AI系统的研究。