LLM2D
VIBES -- 视觉骨干网络高效选择
VIBES -- Vision Backbone Efficient Selection
作者: Joris Guerin, Shray Bansal, Amirreza Shaban, Paulo Mann, Harshvardhan Gazula
发布日期: 10/14/2024
arXiv ID: oai:arXiv.org:2410.08592v1

摘要

本研究着眼于高效选择特定目标任务的高性能预训练视觉主干网络的挑战。尽管在有限的主干网络集合中进行穷举搜索可以解决这个问题,但对于大型数据集和主干网络池而言,这种方法变得不切实际。为了解决这个问题,我们引入了视觉主干网络高效选择(VIBES),旨在快速找到合适的网络主干,并可能在效率方面牺牲最优性。我们提出了一些简单但有效的启发式方法来解决 VIBES,并在四个不同的计算机视觉数据集上对其进行了评估。我们的结果表明,这些方法可以识别出比从通用基准测试中选择的主干网络性能更优异的网络主干,即使在单个 GPU 上的有限搜索预算(一小时)内也是如此。我们认为 VIBES 标志着从基准测试到特定任务优化的范式转变。