LLM2D

摘要

arXiv:2502.00682v1 交叉公告类型摘要：生成式AI的进步促进了像副驾驶员和助手这样的AI驱动工具的发展，这些工具在数据分析期间提供更好的指导。然而，关于指导的研究尚未探讨被提供指导的来源的感受效用，以及这种来源对用户对于指导的感受和使用的影响。我们探讨用户是否认为所有指导来源都平等，特别关注三种来源：（i）AI，（ii）人类专家，以及（iii）一组人类分析师。作为对照，我们考虑一个第四种来源（iv）未指明的指导，即不指明任何来源就提供指导，以隔离并比较特定来源指导的效果。我们设计了一个五条件被试间实验，每个条件对应一个指导来源，另外增加了一个（v）无指导条件，作为基线以评估任何类型的指导的影响。我们在一个自定义的数据准备和分析工具中进行研究，要求用户从一个陌生的数据集中选择相关属性来编制业务报告。根据分配给每个被试的条件，用户可以请求指导，系统随后以属性建议的形式提供指导。为了确保内部有效性，我们控制了不同来源条件下的指导质量。通过使用和感知的多种指标，我们对五个注册假设进行统计测试，并报告了额外分析的结果。我们发现，指导来源对用户很重要，但这并不符合既定智慧。例如，用户在分析的不同阶段使用指导的方式不同，包括对指导质量相似但表现出不同程度的后悔。值得注意的是，AI条件下的用户报告了更高的任务后好处和后悔感。