LLM2D

摘要

arXiv:2505.04207v1 交叉公告类型：cross 摘要：车辙会导致车辆损坏和交通事故，从而引发严重安全和经济问题。因此，早期和准确地检测车辙至关重要。现有的检测方法通常仅基于2D RGB图像，无法准确分析车辙的物理特性。本文创建了一个公开可用的RGB-D图像数据集（PothRGBD），并基于YOLOv8提出了改进模型，用于车辙检测和车辙物理特性分析。使用英特尔RealSense D415深度相机从道路表面收集RGB和深度数据，形成了包含1000张图像的PothRGBD数据集。数据采用适合分割的YOLO格式进行标注。基于YOLOv8n-seg架构提出了一种新型YOLO模型，该模型在结构上进行了改进，加入了动态蛇形卷积（DSConv）、简单注意力模块（SimAM）和高斯误差线性单元（GELU）。所提出的模型更准确地分割了边缘结构不规则的车辙，并且在深度图上进行周长和深度测量的准确性很高。标准模型YOLOv8n-seg在准确率、召回率和mAP@50方面的值分别为91.9%、85.2%和91.9%。使用所提出的模型，这些值分别增加到93.7%、90.4%和93.8%。因此，在精准率、召回率和mAP方面分别取得了1.96%、6.13%和2.07%的改进。所提出的模型在高精度下同时执行车辙检测和周长与深度测量，并且由于其低模型复杂度，适用于实时应用。通过这种方式，已获得一个轻量级且有效的模型，可以用于基于深度学习的智能交通解决方案。