LLM2D
人类对生成型AI对齐的错觉:一个实验室实验
Human Misperception of Generative-AI Alignment: A Laboratory Experiment
作者: Kevin He, Ran Shorrer, Mengjia Xia
发布日期: 2/21/2025
arXiv ID: oai:arXiv.org:2502.14708v1

摘要

arXiv:2502.14708v1 宣告类型:交叉 摘要:我们进行了一项激励实验室实验,以研究人们在经济决策背景下对生成式人工智能(GenAI)对齐的认知。使用涵盖风险、时间偏好、社会偏好和战略互动领域的经济问题面板,我们要求人类受试者为自己作出选择,并预测GenAI代表人类用户所作出的选择。我们发现,人们高估了GenAI选择与人类选择之间的对齐程度。在每个问题中,人类受试者对其认为GenAI选择的平均预测比对其自身选择的平均预测与GenAI选择更为接近。在个体层面上,对于给定问题,不同受试者对其认为GenAI选择的预测与他们自身在相同问题中的选择高度相关。我们在一个简单的理论模型中探讨了人们高估GenAI对齐的影响。