摘要
arXiv:2502.14740v1 交叉公告类型:cross
摘要:本文对YOLOv12的架构进行了分析,YOLOv12是基于其前代的优势实现的单阶段实时目标检测的重要进步,并引入了关键改进。该模型包含了优化的骨干网络(R-ELAN)、7x7 分离卷积以及由FlashAttention驱动的基于区域的注意力机制,这些改进提高了特征提取、提升了效率并增强了检测的稳健性。与前代模型类似,YOLOv12 提供了适用于低延迟和高精度应用的可扩展解决方案。实验结果表明,YOLOv12 在平均准确度均值(mAP)和推断速度方面均表现出了持续的改进,使其成为自主系统、安全和实时分析应用的理想选择。通过在计算效率和性能之间实现最佳平衡,YOLOv12 为实时计算机视觉设立了新的基准,为其在从边缘设备到高性能集群的各种硬件平台上的部署提供了便利。