LLM2D
Home
Arxiv
返回列表
阈值穿越作为 Catastrophic AI 风险的尾事件
Threshold Crossings as Tail Events for Catastrophic AI Risk
作者:
Elija Perrier
发布日期:
3/26/2025
arXiv ID:
oai:arXiv.org:2503.18979v1
摘要
arXiv:2503.18979v1 类型: cross 摘要: 我们分析了导致AI系统在出现极端结果分布的情况下通过分支驱动跳跃的情形。通过分析控制参数在灾难性阈值附近的随机波动如何产生极端结果,我们展示了在何种情况下突然的、大型的转换概率与最终损害分布的尾部概率密切相关。我们的研究成果有助于在试图管理潜在灾难性AI风险时监测、缓解和控制AI系统的研究。
查看原文
下载 PDF