LLM2D

摘要

arXiv:2502.14708v1 宣告类型：交叉摘要：我们进行了一项激励实验室实验，以研究人们在经济决策背景下对生成式人工智能（GenAI）对齐的认知。使用涵盖风险、时间偏好、社会偏好和战略互动领域的经济问题面板，我们要求人类受试者为自己作出选择，并预测GenAI代表人类用户所作出的选择。我们发现，人们高估了GenAI选择与人类选择之间的对齐程度。在每个问题中，人类受试者对其认为GenAI选择的平均预测比对其自身选择的平均预测与GenAI选择更为接近。在个体层面上，对于给定问题，不同受试者对其认为GenAI选择的预测与他们自身在相同问题中的选择高度相关。我们在一个简单的理论模型中探讨了人们高估GenAI对齐的影响。