摘要
arXiv:2502.06909v2 宣告类型: replace-cross
摘要:工业物联网(IIoT)利用联邦学习(FL)进行分布式模型训练,同时保护数据隐私,而元计算通过优化和整合分布式计算资源,提高了效率和可扩展性。高效的IIoT操作需要在模型质量和训练延迟之间取得平衡。因此,FL在IIoT中的主要挑战是通过平衡模型质量和训练延迟来优化整体系统性能。本文设计了一个满意度函数,该函数考虑了数据量、信息年龄(AoI)和训练延迟,以支持元计算。此外,将满意度函数集成到节点的效用函数中,以激励IIoT节点参与模型训练。我们将服务器和节点的效用函数建模为两阶段斯塔克尔伯格博弈,并采用深度强化学习方法学习斯塔克尔伯格均衡。这种方法确保了奖励的平衡,并增强了激励方案在IIoT中的适用性。仿真结果表明,在相同的预算约束下,提出的激励方案在不牺牲模型准确性的情况下,可以提高至少23.7%的效用。