摘要
arXiv:2502.14708v1 宣告类型:交叉
摘要:我们进行了一项激励实验室实验,以研究人们在经济决策背景下对生成式人工智能(GenAI)对齐的认知。使用涵盖风险、时间偏好、社会偏好和战略互动领域的经济问题面板,我们要求人类受试者为自己作出选择,并预测GenAI代表人类用户所作出的选择。我们发现,人们高估了GenAI选择与人类选择之间的对齐程度。在每个问题中,人类受试者对其认为GenAI选择的平均预测比对其自身选择的平均预测与GenAI选择更为接近。在个体层面上,对于给定问题,不同受试者对其认为GenAI选择的预测与他们自身在相同问题中的选择高度相关。我们在一个简单的理论模型中探讨了人们高估GenAI对齐的影响。