LLM2D

摘要

随着机器学习（ML）模型在社会领域中被越来越多地用于做出对人类有重大影响的决策，它们往往有能力重塑数据分布。人类作为战略性主体，不断调整自己的行为以应对学习系统。随着人口的动态变化，ML 系统可能需要频繁更新以确保高性能。然而，在社会领域中获取高质量的人工标注样本可能极具挑战，甚至不可行。解决此问题的一种常见做法是使用模型本身来标注未标注的数据样本。本文研究了当 ML 模型在包含人类战略性响应的情况下，使用模型标注的样本进行重新训练时的长期影响。我们首先将战略性主体与模型之间的交互形式化，然后分析它们在这种动态交互下的演变方式。我们发现，随着模型的重新训练，主体越来越有可能获得积极的决策，而具有积极标签的主体比例可能随着时间的推移而下降。因此，我们提出了一种改进的重新训练过程来稳定动态。最后，我们研究了算法公平性如何受到这些重新训练过程的影响，并发现，在每一轮都强制执行常见的公平性约束可能不会从长远来看有利于弱势群体。在（半）合成和真实数据上的实验验证了理论发现。