LLM2D

摘要

arXiv:2502.00494v2 宣告类型: cross 摘要: 在协作机器学习中，数据估值，即评估每个客户端的数据对机器学习模型的贡献，已成为激励和选择积极数据贡献的关键任务。然而，现有研究往往假设客户端会诚实地进行数据估值，忽视了客户端夸大其贡献的实际动机。为了解决这一问题，本文首次引入了数据过估值攻击，使一些策略性的客户端能够使其数据显著过估值。此外，我们提出了一种诚实的数据估值度量标准，称为Truth-Shapley。Truth-Shapley是唯一一种同时保证数据估值中某些有希望的公理，并确保客户端的最佳策略是进行诚实的数据估值的度量标准。我们的实验证明了现有数据估值度量标准对数据过估值攻击的脆弱性，并验证了Truth-Shapley的鲁棒性和有效性。