LLM2D

摘要

arXiv:2412.18086v2 通知类型: 替换-交叉摘要：运动规划是自动驾驶的核心组成部分。最先进的运动规划器是在精心策划的数据集上进行训练的，这些数据集不仅标注成本高昂，而且在捕捉罕见的致关键场景方面也远不够充分。未能考虑到这样的场景会对运动规划器构成重大风险，并可能导致测试过程中出现事故。一个直观的解决方案是通过编程和执行模拟器（例如CARLA）手动组合这些场景。然而，这种方法会带来巨大的人力成本。受到这一挑战的启发，我们提出了一种低成本的方法来生成多样化的关键交通场景，以训练更稳健的运动规划器。首先，我们将交通场景表示为脚本，然后模拟器使用这些脚本生成交通场景。接下来，我们开发了一种方法，该方法接受用户指定的文本描述，大语言模型通过上下文学习将其转化为脚本。生成的脚本被发送给模拟器，模拟器据此生成相应的交通场景。由于我们的方法能够生成大量的安全关键交通场景，我们使用这些场景作为运动规划器的合成训练数据。为了证明生成场景的价值，我们在我们的合成数据、现实世界数据以及两者的结合上对现有的运动规划器进行了训练。我们的实验表明，使用我们数据训练的运动规划器在性能上显著优于仅使用现实世界数据训练的那些，这表明我们合成数据的有用性和我们数据生成方法的有效性。我们的源代码可在 https://ezharjan.github.io/AutoSceneGen 获得。