LLM2D

摘要

在航运基础设施至关重要的时代，先进的态势感知解决方案变得越来越重要。光学相机系统的使用可以实现对海事影像的实时应用。本论文探讨了利用深度学习和计算机视觉来推进实时船舶识别和地理配准，以改善海事态势感知。论文介绍了一个新的数据集 ShipSG，包含 3,505 张图像和 11,625 个船舶掩码，以及相应的类别和地理位置。在探索最先进技术的基础上，论文为 NVIDIA Jetson AGX Xavier 嵌入式系统设计了一个定制的实时分割架构 ScatYOLOv8+CBAM。该架构在 YOLOv8 中添加了二维散射变换和注意力机制，实现了 75.46% 的 mAP 和 25.3 毫秒的每帧处理时间，比最先进的方法性能提高了 5% 以上。为了提高嵌入式系统中高分辨率图像中小型和远距离船舶的识别率，论文引入了一种增强的切片机制，将 mAP 提高了 8% 到 11%。此外，论文提出了一种地理配准方法，对距离 400 米以内的船舶的定位误差为 18 米，对距离 400 米到 1200 米的船舶的定位误差为 44 米。研究结果还应用于现实世界场景，例如异常船舶行为检测、摄像头完整性评估和 3D 重建。本论文的方法优于现有方法，并为将识别和地理配准的船舶集成到实时系统中提供了一个框架，从而提高了海事利益相关者的运营效率和决策能力。本论文通过建立船舶分割和地理配准研究的基准，证明了基于深度学习的识别和地理配准方法在实时海事监测中的可行性，为海事计算机视觉领域做出了贡献。