LLM2D

摘要

arXiv:2505.08589v1 共跨型通知摘要：本文介绍了一个由无人机在密集城市环境中拍摄的2525张图像组成的多海拔语义分割图像（MESSI）数据集。MESSI在两个主要特性上独具特色。首先，它包含不同海拔高度的图像，允许我们研究深度对语义分割的影响。其次，它包括在多个不同城市区域（不同海拔高度）拍摄的图像。这是因为它涵盖了无人机3D飞行捕获的视觉丰富性，进行了水平和垂直机动。MESSI包含标注有位置、方向以及相机内参的图像，可用于训练深度神经网络进行语义分割或其他感兴趣的应用（例如定位、导航和跟踪）。本文描述了该数据集并提供了标注详情。此外，还解释了使用几种神经网络模型进行语义分割的方法，并展示了相关统计数据。MESSI将在公共领域发布，作为使用无人机或类似车辆拍摄的城市密集环境图像进行语义分割评估的基准。