LLM2D

摘要

arXiv:2401.07456v2 宣告类型: 替换-交叉摘要：联邦学习（FL）是一种有前景的分布式机器学习范式，使得多个客户端能够协作训练全局模型。在本文中，我们重点关注一种实际的多语言联邦学习设置，其中拥有自己语言特定数据的客户端旨在共同构建高质量的神经机器翻译（NMT）模型。然而，实用网络系统中的通信约束为在FL各方之间交换大规模NMT引擎带来了挑战。我们提出了一种基于元学习的自适应参数选择方法MetaSend，该方法在基于联邦学习的多语言NMT训练过程中提高了模型传输的通信效率。我们的方法在不同FL轮次之间学习一个动态阈值，用于在传输前过滤参数，同时不降低NMT模型的质量，基于客户端张量偏差。通过在包含不同语言分布的两个NMT数据集上的实验，我们证明，在有限的通信预算下，MetaSend在翻译质量上相对于基准方法取得了显著的改进。