LLM2D

摘要

arXiv:2504.04419v1 Announce Type: cross 摘要：驾驶场景数据在智能车辆和自动驾驶的发展中发挥着越来越重要的作用。准确高效的场景数据搜索对于在线车辆决策和规划以及离线场景生成和模拟都至关重要，因为它能够利用场景经验来提高整体性能。特别是在大规模语言模型（LLMs）和检索增强生成（RAG）系统在自动驾驶中的应用中，提出了迫切的需求。在本文中，我们引入了Driving-RAG框架，以解决RAG系统中高效场景数据嵌入、搜索和应用的挑战。我们的嵌入模型在向量空间中对基本场景信息和场景距离度量进行对齐。结合典型的场景采样方法和分层导航的小世界结构，可以高效地执行场景向量搜索，以实现高效搜索而不牺牲准确性。此外，通过图知识进行的重组机制增强了与提示场景的相关性并增强LLM生成。我们在复杂的交互场景（如匝道和交叉口）的典型轨迹规划任务上表明了所提出框架的有效性，展示了其在RAG应用中的优势。