摘要
arXiv:2504.18039v1 公告类型: 新增
摘要:大型语言模型(LLM)代理已经在如狼人杀这样的社会推理游戏(SDGs)中展示了令人印象深刻的能力,其中策略推理和社会欺骗至关重要。然而,当前的方法仅限于处理文本信息,忽略了人类自然使用的至关重要的多模态线索,如面部表情和语调。此外,现有的SDG代理主要关注推断其他玩家的身份,而没有建模他人如何看待自己或同行玩家。为了应对这些局限性,我们以One Night Ultimate Werewolf (ONUW)为测试平台,并提出了MultiMind,这是第一个集成多模态信息到SDG代理中的框架。MultiMind在处理面部表情和声调的同时,还利用一个心理理论模型(ToM模型)来表示每个玩家对其他玩家的怀疑程度。通过将这种ToM模型与蒙特卡洛树搜索(MCTS)结合,我们的代理识别出可以最大限度地减少对自己怀疑的沟通策略。通过在代理对抗代理的模拟以及与人类玩家的研究中进行全面评估,我们证明了MultiMind在游戏中的优越性能。我们的工作展示了一种向跨多模态领域具有类似人类社会推理能力的LLM代理的重大进展。