LLM2D
基于第一原理的风险评估框架和IEEE P3396标准
A First-Principles Based Risk Assessment Framework and the IEEE P3396 Standard
作者: Richard J. Tong, Marina Cort\^es, Jeanine A. DeFalco, Mark Underwood, Janusz Zalewski
发布日期: 4/7/2025
arXiv ID: oai:arXiv.org:2504.00091v1

摘要

arXiv:2504.00091v1 宣告类型:交叉 摘要:生成型人工智能(AI)在内容创作和决策支持方面实现了前所未有的自动化,但也带来了新的风险。本文提出了一个基于IEEE P3396推荐实践的AI风险、安全、可靠性和责任的基础风险评估框架。我们区分了过程风险(源于AI系统构建或操作的风险)和结果风险(表现在AI系统输出及其现实世界影响的风险),认为生成型AI治理应优先考虑结果风险。我们方法的核心是一个信息为中心的本体论,将AI生成的输出分类为四大基本类别:(1) 感知级信息,(2) 知识级信息,(3) 决策/行动计划信息,以及(4) 控制令牌(访问或资源指令)。这种分类使得系统性识别危害和根据所生成信息的性质精确归咎责任成为可能,从而为开发者、部署者、用户和监管者分配责任。我们说明了每种信息类型所包含的独特结果风险(例如:欺诈、错误信息、不安全的建议、安全漏洞)及其需要定制的风险指标和缓解措施。通过将框架建立在信息的本质、人类代理和认知的基础上,我们将风险评估与AI输出对人类理解和行动的影响相契合。结果是,本文提供了一种有原则的AI风险管理方法,支持明确的责任分配和有针对性的保护措施,而不是广泛的基于应用程序的风险分类。我们还提供了示例表格,将信息类型映射到风险和责任。本文旨在通过一个严谨且基于第一性原理的基础框架来指导IEEE P3396推荐实践和更广泛的AI治理,从而促进生成型AI风险的评估和负责任的创新。