LLM2D
LangCoop: 语言协作驾驶
LangCoop: Collaborative Driving with Language
作者: Xiangbo Gao, Yuheng Wu, Rujia Wang, Chenxi Liu, Yang Zhou, Zhengzhong Tu
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.13406v2

摘要

arXiv:2504.13406v2 通告类型: 替换-交叉 摘要:多agent协作在通过使多个连接agent之间实现信息共享来增强自主驾驶系统的安全、可靠性和移动性方面具有巨大的潜力。然而,现有的多agent通信方法受到现有通信媒介限制的影响,包括高带宽需求、agent异构性和信息丢失。为了应对这些挑战,我们引入了LangCoop,这是一种利用自然语言作为紧凑且富有表现力的中间媒介进行agent之间通信的新范式。LangCoop 有两个关键创新:混合模型模块化推理链(M$^3$CoT),用于结构化的零shot 视觉-语言推理,以及自然语言信息包装(LangPack),用于高效地将信息包装成简短的语言基消息。通过在CARLA模拟中进行的大量实验,我们证明了LangCoop 相比基于图像的通信实现了令人瞩目的96%的通信带宽减少(每条消息少于2KB),同时在闭环评估中保持了竞争力的驾驶性能。我们的项目页面和代码可在 https://xiangbogaobarry.github.io/LangCoop/ 查看。