LLM2D
2024 BRAVO 挑战赛第一赛道冠军方案报告:评估视觉基础模型在语义分割中的鲁棒性
2024 BRAVO Challenge Track 1 1st Place Report: Evaluating Robustness of Vision Foundation Models for Semantic Segmentation
作者: Tommie Kerssies, Daan de Geus, Gijs Dubbelman
发布日期: 9/27/2024
arXiv ID: oai:arXiv.org:2409.17208v1

摘要

本报告介绍了我们针对 2024 年 BRAVO 挑战赛第一赛道提出的解决方案,该解决方案训练了一个在 Cityscapes 数据集上训练的模型,并在多个分布外数据集上评估了其鲁棒性。我们的解决方案利用了视觉基础模型学习到的强大表示,通过在 DINOv2 上附加一个简单的分割解码器并对整个模型进行微调来实现。这种方法优于更复杂的现有方法,并在挑战赛中获得第一名。我们的代码已公开发布在 https://github.com/tue-mps/benchmark-vfm-ss。