摘要
机器学习 (ML) 模型在各种应用中越来越普遍,从电子商务中的推荐系统到医疗保健中的诊断预测。本文提出了一种新颖的动态框架,用于思考在执行性的人机协作系统中部署 ML 模型。在我们的框架中,ML 建议的引入改变了人类决策的数据生成过程,而人类决策只是对真实情况的代理,然后用于训练模型的未来版本。我们表明,原则上,这个动态过程可以收敛到不同的稳定点,即 ML 模型和人机协作系统具有相同的性能。其中一些稳定点相对于实际真实情况来说是次优的。作为概念验证,我们对 1,408 名参与者进行了实证用户研究。在研究中,人类在机器学习预测(性能各不相同)的帮助下解决了背包问题实例。这是一个理想的环境,因为我们可以识别出实际的真实情况,并评估由 ML 建议支持的人类决策的性能。我们发现,对于许多级别的 ML 性能,人类可以改进 ML 预测。我们还发现,如果人类理性地遵循 ML 建议,改进可能更高。最后,我们测试了金钱激励是否可以提高人类决策的质量,但我们没有发现任何积极影响。使用我们的经验数据来近似我们的协作系统表明,学习过程将动态地达到一个平衡性能,大约为最大背包值的 92%。我们的结果对在人类决策可能偏离不可辩驳的真实情况的背景下部署 ML 模型具有实际意义。