LLM2D
无线边缘的鲁棒多任务大语言模型融合
R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge
作者: Aladin Djuhera, Vlad C. Andrei, Mohsen Pourghasemian, Haris Gacanin, Holger Boche, Walid Saad
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.18220v1

摘要

多任务大型语言模型 (MTLLM) 对于许多无线边缘应用至关重要,因为用户需要专门的模型来高效处理多项任务。然而,训练 MTLLM 复杂且耗时,尤其是在任务发生变化时。最近,通过任务向量进行模型融合的概念已成为一种有效的组合微调参数以生成 MTLLM 的方法。本文研究了在最坏情况下的对抗性攻击下,使边缘用户能够通过任务向量协作构建此类 MTLLM 的问题。为此,首先研究了对抗性噪声对多任务模型融合的影响,并推导了所谓的权重 disentanglement 误差和均方误差 (MSE) 之间的关系。利用假设检验,直接证明了 MSE 增加了任务向量之间的干扰,从而导致模型融合无效。然后,提出了一种新颖的鲁棒 MTLLM 融合 (R-MTLLMF) 方法,该方法利用关于 LLM 架构和微调过程的见解,通过重新调整 MTLLM 来保护任务向量聚合免受对抗性噪声的影响。然后,在最坏情况和理想传输场景下比较所提出的 R-MTLLMF,以研究无线信道的影响。使用视觉 LLM 进行的大量模型融合实验证明了 R-MTLLMF 的有效性,在理想噪声场景下,它在八个不同的任务中实现了接近基线的性能,并且在最坏情况场景下显著优于未受保护的模型融合。结果进一步倡导对整体方法的弹性进行额外的物理层保护,从无线和 LLM 的角度来看。