LLM2D

摘要

arXiv:2504.12817v1 交叉公告类型摘要：本文探讨了将图神经网络（GNNs）与定性可解释图（QXGs）结合以在自动驾驶中实现场景理解的方法。场景理解是任何进一步反应性或主动决策的基础。场景理解和相关推理本质上是一个解释任务：为什么其他交通参与者在做某事，是什么或谁导致了他们的行为？尽管以前的工作利用浅层机器学习模型展示了QXGs的有效性，这些方法仅限于分析对象对之间的单一关系链，忽略了更广泛的场景上下文。我们提出了一种新颖的GNN架构，用于处理整个图结构，以识别交通场景中的相关对象。我们使用nuScenes数据集进行评估，该数据集富含DriveLM的人标注的相关性标签。实验结果表明，基于GNN的方法在基准方法相比取得了更好的性能。该模型有效解决了在识别相关对象任务中固有的类不平衡问题，并考虑了场景中所有对象的完整时空关系。我们的工作展示了将定性表示与深度学习方法结合用于自动驾驶系统中具有解释性的场景理解的潜力。