LLM2D

摘要

本研究旨在全面回顾和实证评估多模态大型语言模型 (MLLMs) 和大型视觉模型 (VLMs) 在交通系统目标检测中的应用。首先，我们介绍了 MLLMs 在交通应用中的潜在优势，并对先前研究中现有的 MLLM 技术进行了全面回顾。我们重点介绍了它们在各种交通场景中目标检测的有效性和局限性。第二部分概述了交通应用中端到端目标检测的分类以及未来方向。在此基础上，我们提出了对三个真实交通问题的实证分析，这些问题包括目标检测任务，即道路安全属性提取、安全关键事件检测和热图像的视觉推理。我们的发现对 MLLMs 的性能进行了详细评估，揭示了其优势和改进空间。最后，我们讨论了 MLLMs 在增强交通目标检测方面的实际局限性和挑战，从而为该关键领域的未来研究和发展提供路线图。