LLM2D

摘要

arXiv:2503.15514v2 通知类型: 替换-交叉摘要：随着人工智能在某些任务上超过人类的表现，披露超人类能力给公平性、问责制和信任带来了独特的挑战。然而，此类披露对不同用户的态度和行为的影响尚不清楚，尤其是关于可能的负面反应，如沮丧或过度依赖。本文通过使用Persona Cards（一种经过验证的标准合成人格集，旨在模拟多样化的用户反应和公平性观点）来研究这些影响。我们进行了一个经过伦理委员会批准的研究（N=32），利用这些人格来研究能力披露如何影响与超级游戏AI在竞争性星际争霸II场景中的行为。我们的结果显示透明性是一把双刃剑：虽然披露可以缓解怀疑，但它也可能在合作场景中引发初学者的沮丧和战略悲观，以及在竞争环境中引发过度依赖。有经验的竞争玩家将披露视为不可战胜对手的确认，从而转向非最优目标。我们发布了Persona Cards数据集，包括个人档案、提示、互动日志和协议，以促进人类对齐AI设计的可重复研究。这项工作表明，透明性并非万能药；成功利用披露增强信任和问责制需要针对用户特征、领域规范和具体公平目标进行精细的调整。