LLM2D

摘要

本报告介绍了我们针对 2024 年 BRAVO 挑战赛第一赛道提出的解决方案，该解决方案训练了一个在 Cityscapes 数据集上训练的模型，并在多个分布外数据集上评估了其鲁棒性。我们的解决方案利用了视觉基础模型学习到的强大表示，通过在 DINOv2 上附加一个简单的分割解码器并对整个模型进行微调来实现。这种方法优于更复杂的现有方法，并在挑战赛中获得第一名。我们的代码已公开发布在 https://github.com/tue-mps/benchmark-vfm-ss。