LLM2D

摘要

arXiv:2504.08915v1 类型: cross 摘要: 视觉基础模型 (VFMs) 是大型预训练模型，构成各种视觉任务的基础。细调 VFMs 可以进一步释放其在下游任务或场景中的潜力。然而，VFMs 经常包含显著的特征冗余，这可能会限制其对新任务的适应能力。在本文中，我们研究了 segment anything 模型 (SAM) 中的冗余，并提出了一种无参数的细调方法来解决这一问题。与传统的调整参数的细调方法不同，我们的方法强调选择、重用和增强预训练特征，提供了模型细调的新视角。具体来说，我们引入了一种基于模型输出差异的通道选择算法，以识别冗余且有效的通道。通过有选择地用更有效的通道替换冗余通道，我们过滤掉不太有用的功能，并重新利用更相关的功能以适应下游任务，从而增强任务特定的功能表示。在跨域和同域数据集上的实验验证了我们方法的效率和有效性。值得注意的是，我们的方法可以无缝集成现有的细调策略（例如 LoRA、Adapter），进一步提高已细调模型的性能。此外，由于我们的通道选择仅涉及模型推理，我们的方法显著减少了计算和 GPU 内存开销。