LLM2D

摘要

arXiv:2504.03718v1 类型: cross 摘要：大型语言模型（LLMs）在决策制定、推理和问答等各种任务中取得了显著的成功，并且已经在边缘设备上得到了广泛应用。然而，由于边缘设备上的高计算成本以及有限的存储和能源资源，针对特定任务对LLMs进行微调仍然是一个挑战。为此，我们提出了TaskEdge，这是一种适用于边缘设备的任务感知参数高效微调框架，该框架将最有效的参数分配给目标任务，并仅更新特定于任务的参数。具体来说，我们首先设计了一个参数重要性计算标准，该标准将权重和输入激活都纳入了权重重要性的计算中。然后，我们提出了一种模型无关的任务特定参数分配算法，以确保特定于任务的参数能够在模型中均匀分布，而不是集中于特定区域。通过这样做，TaskEdge可以在更新不到0.1%的参数的情况下，显著降低计算成本和内存使用量，同时在下游目标任务上保持性能。此外，TaskEdge可以轻松集成到结构化稀疏性中，从而利用 NVIDIA 的专门稀疏张量核实现加速，还可以无缝集成 LoRA，以实现高效的稀疏低秩适应。在各种任务上的 extensive 实验表明了 TaskEdge 的有效性。