LLM2D
增强的YOLOv8模型用于实时和准确的坑洞检测与测量
An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement
作者: Mustafa Yurdakul, \c{S}akir Tasdemir
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04207v1

摘要

arXiv:2505.04207v1 交叉公告类型:cross 摘要:车辙会导致车辆损坏和交通事故,从而引发严重安全和经济问题。因此,早期和准确地检测车辙至关重要。现有的检测方法通常仅基于2D RGB图像,无法准确分析车辙的物理特性。本文创建了一个公开可用的RGB-D图像数据集(PothRGBD),并基于YOLOv8提出了改进模型,用于车辙检测和车辙物理特性分析。使用英特尔RealSense D415深度相机从道路表面收集RGB和深度数据,形成了包含1000张图像的PothRGBD数据集。数据采用适合分割的YOLO格式进行标注。基于YOLOv8n-seg架构提出了一种新型YOLO模型,该模型在结构上进行了改进,加入了动态蛇形卷积(DSConv)、简单注意力模块(SimAM)和高斯误差线性单元(GELU)。所提出的模型更准确地分割了边缘结构不规则的车辙,并且在深度图上进行周长和深度测量的准确性很高。标准模型YOLOv8n-seg在准确率、召回率和mAP@50方面的值分别为91.9%、85.2%和91.9%。使用所提出的模型,这些值分别增加到93.7%、90.4%和93.8%。因此,在精准率、召回率和mAP方面分别取得了1.96%、6.13%和2.07%的改进。所提出的模型在高精度下同时执行车辙检测和周长与深度测量,并且由于其低模型复杂度,适用于实时应用。通过这种方式,已获得一个轻量级且有效的模型,可以用于基于深度学习的智能交通解决方案。