摘要
本研究旨在全面回顾和实证评估多模态大型语言模型 (MLLMs) 和大型视觉模型 (VLMs) 在交通系统目标检测中的应用。首先,我们介绍了 MLLMs 在交通应用中的潜在优势,并对先前研究中现有的 MLLM 技术进行了全面回顾。我们重点介绍了它们在各种交通场景中目标检测的有效性和局限性。第二部分概述了交通应用中端到端目标检测的分类以及未来方向。在此基础上,我们提出了对三个真实交通问题的实证分析,这些问题包括目标检测任务,即道路安全属性提取、安全关键事件检测和热图像的视觉推理。我们的发现对 MLLMs 的性能进行了详细评估,揭示了其优势和改进空间。最后,我们讨论了 MLLMs 在增强交通目标检测方面的实际局限性和挑战,从而为该关键领域的未来研究和发展提供路线图。