摘要
我们提出了一种在联邦学习环境中检测全局异常值的新策略,特别针对跨部门场景。我们的方法涉及使用两个服务器,并将客户端的掩码本地数据传输到其中一个服务器。数据的掩码处理防止了敏感信息的泄露,同时仍然允许识别异常值。此外,为了进一步保护隐私,实施了一种排列机制,使得服务器不知道任何掩码数据点属于哪个客户端。服务器对掩码数据进行异常值检测,使用Isolation Forest或其扩展版本,然后将异常值信息反馈给客户端,使它们能够在开始任何后续的联邦模型训练之前识别并移除本地数据集中的异常值。这种方法在集中执行Isolation Forest算法于原始数据上时,提供了可比的结果。