摘要
arXiv:2502.18682v2 宣告类型: replace-cross
摘要:人工智能系统常常伴随着高的期望被引入,但许多系统未能兑现,导致未预见的危害和错失了利益的机会。我们经常观察到显著的“AI不匹配”,即系统的实际性能未能达到确保安全和共同创造价值所需的标准。这些不匹配在开发过程中尤为难以解决,突显了早期干预的必要性。导航导致AI不匹配的复杂、多维风险因素是一项持续的挑战。为了应对这一挑战,我们提出了一种AI不匹配方法,以早期预见和缓解风险,重点关注现实模型性能与所需任务性能之间的差距。通过对774个人工智能案例的分析,我们提取出一组关键因素,这为开发出七个矩阵提供了依据,这些矩阵映射了这些因素之间的关系并突显了高风险区域。通过案例研究,我们展示了我们的方法如何有助于降低人工智能开发中的风险。