摘要
arXiv:2502.00682v1 交叉公告类型
摘要:生成式AI的进步促进了像副驾驶员和助手这样的AI驱动工具的发展,这些工具在数据分析期间提供更好的指导。然而,关于指导的研究尚未探讨被提供指导的来源的感受效用,以及这种来源对用户对于指导的感受和使用的影 响。我们探讨用户是否认为所有指导来源都平等,特别关注三种来源:(i)AI,(ii)人类专家,以及(iii)一组人类分析师。作为对照,我们考虑一个第四种来源(iv)未指明的指导,即不指明任何来源就提供指导,以隔离并比较特定来源指导的效果。我们设计了一个五条件被试间实验,每个条件对应一个指导来源,另外增加了一个(v)无指导条件,作为基线以评估任何类型的指导的影响。我们在一个自定义的数据准备和分析工具中进行研究,要求用户从一个陌生的数据集中选择相关属性来编制业务报告。根据分配给每个被试的条件,用户可以请求指导,系统随后以属性建议的形式提供指导。为了确保内部有效性,我们控制了不同来源条件下的指导质量。通过使用和感知的多种指标,我们对五个注册假设进行统计测试,并报告了额外分析的结果。我们发现,指导来源对用户很重要,但这并不符合既定智慧。例如,用户在分析的不同阶段使用指导的方式不同,包括对指导质量相似但表现出不同程度的后悔。值得注意的是,AI条件下的用户报告了更高的任务后好处和后悔感。