LLM2D

摘要

arXiv:2503.18979v1 类型: cross 摘要: 我们分析了导致AI系统在出现极端结果分布的情况下通过分支驱动跳跃的情形。通过分析控制参数在灾难性阈值附近的随机波动如何产生极端结果，我们展示了在何种情况下突然的、大型的转换概率与最终损害分布的尾部概率密切相关。我们的研究成果有助于在试图管理潜在灾难性AI风险时监测、缓解和控制AI系统的研究。