摘要
零样本协调 (ZSC) 是多智能体协作中的一个重大挑战,旨在开发能够与之前从未遇到过的未知伙伴进行协调的智能体。最近最先进的 ZSC 方法主要集中在双人视频游戏中,例如《煮糊了 2》和《花牌》。本文将 ZSC 研究的范围扩展到多无人机协同追捕场景,探讨如何构建能够与多个未知伙伴协调以捕获多个逃逸者的无人机智能体。我们提出了一种新颖的超图开放式学习算法 (HOLA-Drone),该算法基于我们的超图形式博弈建模不断调整学习目标,旨在提高与多个未知无人机队友的协作能力。为了从经验上验证 HOLA-Drone 的有效性,我们构建了两个不同的未知无人机队友池,以评估它们与各种未知伙伴协调时的性能。实验结果表明,HOLA-Drone 在与未知无人机队友协调方面优于基线方法。此外,现实世界实验验证了 HOLA-Drone 在物理系统中的可行性。视频可在项目主页~\url{https://sites.google.com/view/hola-drone} 上找到。