LLM2D

摘要

arXiv:2504.13406v2 通告类型: 替换-交叉摘要：多agent协作在通过使多个连接agent之间实现信息共享来增强自主驾驶系统的安全、可靠性和移动性方面具有巨大的潜力。然而，现有的多agent通信方法受到现有通信媒介限制的影响，包括高带宽需求、agent异构性和信息丢失。为了应对这些挑战，我们引入了LangCoop，这是一种利用自然语言作为紧凑且富有表现力的中间媒介进行agent之间通信的新范式。LangCoop 有两个关键创新：混合模型模块化推理链（M$^3$CoT），用于结构化的零shot 视觉-语言推理，以及自然语言信息包装（LangPack），用于高效地将信息包装成简短的语言基消息。通过在CARLA模拟中进行的大量实验，我们证明了LangCoop 相比基于图像的通信实现了令人瞩目的96%的通信带宽减少（每条消息少于2KB），同时在闭环评估中保持了竞争力的驾驶性能。我们的项目页面和代码可在 https://xiangbogaobarry.github.io/LangCoop/ 查看。