摘要
arXiv:2503.15514v2 通知类型: 替换-交叉
摘要:随着人工智能在某些任务上超过人类的表现,披露超人类能力给公平性、问责制和信任带来了独特的挑战。然而,此类披露对不同用户的态度和行为的影响尚不清楚,尤其是关于可能的负面反应,如沮丧或过度依赖。本文通过使用Persona Cards(一种经过验证的标准合成人格集,旨在模拟多样化的用户反应和公平性观点)来研究这些影响。我们进行了一个经过伦理委员会批准的研究(N=32),利用这些人格来研究能力披露如何影响与超级游戏AI在竞争性星际争霸II场景中的行为。我们的结果显示透明性是一把双刃剑:虽然披露可以缓解怀疑,但它也可能在合作场景中引发初学者的沮丧和战略悲观,以及在竞争环境中引发过度依赖。有经验的竞争玩家将披露视为不可战胜对手的确认,从而转向非最优目标。我们发布了Persona Cards数据集,包括个人档案、提示、互动日志和协议,以促进人类对齐AI设计的可重复研究。这项工作表明,透明性并非万能药;成功利用披露增强信任和问责制需要针对用户特征、领域规范和具体公平目标进行精细的调整。