LLM2D

摘要

随着机器学习（ML）模型在社会领域中被越来越多地用于做出对人类有重大影响的决策，它们往往具有重塑数据分布的能力。人类作为战略性主体，不断调整其行为以应对学习系统。由于人口动态变化，ML 系统可能需要频繁更新以确保高性能。然而，在社会领域获取高质量的人工标注样本可能极具挑战，甚至不可行。解决此问题的一种常见做法是使用模型本身来标注未标注的数据样本。本文研究了当 ML 模型在包含人类战略性响应的情况下使用模型标注样本进行再训练时，其长期影响。我们首先将战略性主体与模型之间的交互形式化，然后分析它们在这种动态交互下的演变过程。我们发现，随着模型的重新训练，主体越来越有可能获得积极的决策，而具有积极标签的群体比例可能会随着时间的推移而下降。因此，我们提出了一种改进的再训练过程来稳定这种动态。最后，我们考察了这些再训练过程如何影响算法公平性，并发现，在每一轮都强制执行常见的公平性约束可能不会从长远来看有利于弱势群体。在（半）合成数据和真实数据上的实验验证了理论发现。