摘要
arXiv:2505.09737v1 宣布类型: 新文章
摘要:通过其行为理解代理的意图在人机交互、交互式人工智能系统和多代理协作中至关重要。这一任务,即目标识别(GR),在目标众多且不断变化的动态环境中提出了重大挑战。传统的GR方法,针对预定义的目标集,往往难以适应这些动态场景。为了解决这一局限,我们提出了通用动态GR问题——一种更广泛的GR定义——旨在使实时GR系统成为可能,并进一步推动该领域的研究。在此基础上,本文采用一种无模型的目标条件强化学习方法,使GR在各种变化的任务中能够快速适应。