摘要
arXiv:2409.13783v1 公告类型: 交叉 摘要: 为解决网联自动驾驶车辆(CAVs)的多车协同驾驶中的横向与纵向联合决策问题,本文提出了一种基于有限视野和时间折扣设置的多智能体马尔可夫博弈的蒙特卡洛树搜索(MCTS)方法,并采用并行更新策略。通过分析部分稳态交通流中多车联合行动空间中的并行动作,并行更新方法能够快速排除潜在的危险动作,从而在不牺牲搜索广度的情况下增加搜索深度。该方法在大量随机生成的交通流中进行了测试。实验结果表明,该算法具有良好的鲁棒性,并且在性能上优于现有的强化学习算法和启发式方法。采用该算法生成的车辆驾驶策略表现出超越人类驾驶员的合理性,并在协调区域内的交通效率和安全性方面具有优势。