摘要
arXiv:2502.00494v1 宣告类型: cross
摘要:在协作机器学习中,数据估值,即评估每个客户端的数据对机器学习模型的贡献,已成为激励和选择积极数据贡献的关键任务。然而,现有研究通常假设客户端会诚实地进行数据估值,忽视了客户端夸大其贡献的实际动机。为了解决这一问题,本文首次引入了数据过估值攻击,使战略性的客户端能够使其数据被显著高估。此外,我们提出了一种诚信数据估值指标,名为 Truth-Shapley。Truth-Shapley 是唯一确保某些有希望的数据估值公理的指标,同时确保客户端的最佳策略是进行诚信数据估值。我们的实验表明现有的数据估值指标对数据过估值攻击的脆弱性,并验证了 Truth-Shapley 的稳健性和有效性。