LLM2D

摘要

arXiv:2502.06909v2 宣告类型: replace-cross 摘要：工业物联网（IIoT）利用联邦学习（FL）进行分布式模型训练，同时保护数据隐私，而元计算通过优化和整合分布式计算资源，提高了效率和可扩展性。高效的IIoT操作需要在模型质量和训练延迟之间取得平衡。因此，FL在IIoT中的主要挑战是通过平衡模型质量和训练延迟来优化整体系统性能。本文设计了一个满意度函数，该函数考虑了数据量、信息年龄（AoI）和训练延迟，以支持元计算。此外，将满意度函数集成到节点的效用函数中，以激励IIoT节点参与模型训练。我们将服务器和节点的效用函数建模为两阶段斯塔克尔伯格博弈，并采用深度强化学习方法学习斯塔克尔伯格均衡。这种方法确保了奖励的平衡，并增强了激励方案在IIoT中的适用性。仿真结果表明，在相同的预算约束下，提出的激励方案在不牺牲模型准确性的情况下，可以提高至少23.7%的效用。