LLM2D

摘要

arXiv:2410.15912v2 更新类型: replace-cross 摘要：尽管自主驾驶的能力已经取得了快速进步，但与密集交通流汇入仍然是一个重大挑战。针对这一场景已经提出了许多运动规划方法，但很难评估它们的质量。大多数现有的闭环模拟器依赖基于规则的控制来处理其他车辆的行为，这导致了缺乏多样性和随机性，从而无法准确评估在高度交互场景中的运动规划能力。此外，传统的评估指标对于全面评估密集交通流中的并线性能是不够的。为应对这些挑战，我们提出了一种闭环评估基准，用于评估并线场景中的运动规划能力。我们的方法包括训练在大规模数据集中的其他车辆，这些车辆具有微行为特征，显著增加了复杂性和多样性。此外，我们通过利用大型语言模型重构了评估机制，以评估每辆自主车辆进入主路的情况。广泛的实验已经证明了此评估基准的先进性。通过这一基准，我们已经对现有方法进行了评估并识别出了常见问题。我们设计的环境和车辆运动规划模型可以在 https://anonymous.4open.science/r/Bench4Merge-EB5D 访问。