LLM2D

摘要

arXiv:2505.01016v1 宣言类型: cross 摘要：大型预训练对象检测器的成功在于其对多样化的下游任务的适应能力。尽管微调是标准的适应方法，但对于具有挑战性的细分类别领域，这些模型需要精心考虑特征的粒度。关键问题在于：在优化专门任务的同时，预训练骨干网络应该微调多深入，以最大化原始通用能力的保留，而不发生灾难性遗忘？为解决这一问题，我们进行了一项系统性的实证研究，评估了微调深度的影响。我们通过逐步解冻骨干层（在第22层、第15层和第10层冻结点）并进行训练，将标准的YOLOv8n模型适应到一个自定义的细粒度水果检测数据集。性能在目标水果数据集上进行了严格的评估，并通过双头评估架构，在原始COCO验证集上进行了评估。我们的结果显示，与仅训练头部相比，微调至第10层的深度微调在细粒度水果任务上的性能显著提高（例如，绝对mAP50增益达到10%）。令人惊讶的是，在所有测试的冻结级别上，这种显著的适应和专业化对COCO基准测试的性能降级几乎可以忽略不计（绝对mAP差异小于0.1%）。我们得出结论，适应中到晚期的骨干特征对于细粒度专业化非常有效。关键的是，我们的结果证明，可以在没有通常预期的灾难性遗忘惩罚的情况下实现这种适应，这为探索更深的微调策略提供了有力的依据，特别是在针对复杂领域或在最大化专业化性能方面尤为重要。