LLM2D

摘要

arXiv:2502.04419v1 Announce Type: cross 摘要：通过大型语言模型（LLMs）本身生成合成数据集已成为提高LLM性能的一种有潜力的方法。然而，LLMs本质上反映了其训练数据中存在的偏差，这导致了一个关键挑战：当这些模型生成用于训练的合成数据时，它们可能会传播和放大其固有的偏差，这些偏差可以显著影响下游任务中的模型公平性和鲁棒性——我们称这种现象为偏差继承。本文提出了首个系统性地研究、分析和缓解偏差继承的工作。我们通过微调LLMs，使用包含原始数据和LLM增强数据的组合数据集来研究这一问题，其中偏差比例代表增强数据的比例。通过在10个分类和生成任务上的系统实验，我们分析了不同类型的偏差在不同偏差比例下的表现。我们的结果揭示了偏差继承对下游任务的影响具有复杂性，对分类任务和生成任务的影响不同。然后，我们的分析识别了三个关键的不一致性因素：价值观的不一致、群组数据的不一致和数据分布的不一致。基于这些见解，我们提出了三种缓解策略：基于令牌、基于掩码和基于损失的方法。实验表明，这些策略在不同任务和偏差上的效果不同，说明了完全缓解偏差继承的显著挑战。我们希望这项工作可以为LLM数据增强的研究提供有价值的见解。