LLM2D

摘要

arXiv:2504.02450v2 通知类型: 替换-交叉摘要: 为了解决自主驾驶仿真中行为智能有限和车辆行为模型过于简化的挑战，本文提出了一种认知分层代理用于推理和运动风格化 (CHARMS)。利用 Level-k 博弈理论，我们通过强化学习预训练和监督微调来建模人类驾驶员的决策。这使得生成的模型能够表现出多样的行为，从而提高了仿真中周围车辆的智能和真实性。基于这一能力，我们进一步开发了一种情景生成框架，该框架利用泊松认知层次理论通过泊松和二项式抽样来控制不同驾驶风格车辆的数量分布。实验结果表明，CHARMS 既能够作为ego车辆做出智能决策，又能够生成多样且真实的驾驶场景。CHARMS 的代码将在 https://github.com/WUTAD-Wjy/CHARMS 释放。