LLM2D
数据高估攻击与真实的數據估值
Data Overvaluation Attack and Truthful Data Valuation
作者: Shuyuan Zheng, Sudong Cai, Chuan Xiao, Yang Cao, Jianbin Qin, Masatoshi Yoshikawa, Makoto Onizuka
发布日期: 2/5/2025
arXiv ID: 2502.00494

摘要

arXiv:2502.00494v2 公告类型: replace-cross 摘要:在协作机器学习中,数据估值,即评估每个客户端的数据对机器学习模型的贡献,已成为激励和选择积极数据贡献的关键任务。然而,现有研究往往假定客户端会诚实地进行数据估值,忽视了客户端夸大其贡献的实际动机。为了应对这一威胁,本文提出了第一个数据过估攻击,使得战略性客户端的数据能被显著高估。此外,我们提出了一种真诚的数据估值指标,名为 Truth-Shapley。Truth-Shapley 是唯一一种在保证数据估值某些有前景的公理的同时,确保客户端的最佳策略是进行真诚的数据估值的指标。我们的实验展示了现有数据估值指标对数据过估攻击的脆弱性,并验证了 Truth-Shapley 的稳健性和有效性。