摘要
arXiv:2411.01553v2 通信类型: 替换-交叉
摘要:有效的沟通是协作多智能体系统的重要组成部分。历史上,人类社会中经常出现无法进行显式消息传递的情况,这推动了对隐式沟通的研究。以往关于学习隐式沟通的工作大多依赖于理论思维(Theory of Mind,ToM),其中智能体通过解释他人的行为来推断他人的心理状态和意图。然而,在复杂的任务中,基于ToM的方法在进行准确推断方面变得不太有效。在本文中,我们提出了一种隐式渠道协议(ICP)框架,该框架允许智能体通过类似于显式通信渠道的隐式通信渠道进行沟通。ICP 利用了一组动作,称为探索动作,并利用信息与这些探索动作之间的映射来编码和解码消息。我们提出了智能体进行消息传递和行动的训练算法,包括使用随机初始化的信息映射和使用延迟的信息映射。ICP 在猜数字、揭示目标和汉诺塔任务中的有效性已被测试,在这些任务中,ICP 通过更有效的信息传递显著优于基线方法。