LLM2D
人类-人工智能治理(HAIG):一种信任-效用方法
Human-AI Governance (HAIG): A Trust-Utility Approach
作者: Zeynep Engin
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.01651v1

摘要

arXiv:2505.01651v1 宣传类型: 新 摘要: 本文介绍了HAIG框架,用于分析人类-AI关系在演变过程中信任动态的变化。目前的分类框架(例如,“人类在环中”模型)未能充分捕捉AI系统从工具转变为合作伙伴的过程,特别是在基础模型展示出新兴能力以及多智能体系统表现出自主目标设定行为的情况下。随着系统的进步,代理权在复杂的模式下重新分配,这些模式更适合作为连续统中的位置而不是离散的类别表示,尽管进步可能包括渐进的变化和重要的阶段变更。HAIG框架在三个层级上运作:维度(决策权威分配、过程自主权和问责制配置)、连续统(每个维度上的渐进变化)和门槛(需要治理适应的关键点)。与基于风险或基于原则的方法不同,HAIG采用信任-效用导向,重点关注维持适当的信任关系,以最大化效用并确保足够的保障措施。我们的分析揭示了技术进步(包括自我监督、推理权威和分散决策制定)如何在情境变化和技术进步的背景下驱动信任演化的非均匀变化。健康医疗和欧盟法规案例研究展示了HAIG如何补充现有框架,同时也为预测治理挑战提供了一个基础,使其能够提出相应的替代方法。