LLM2D

摘要

arXiv:2505.09737v1 宣布类型: 新文章摘要：通过其行为理解代理的意图在人机交互、交互式人工智能系统和多代理协作中至关重要。这一任务，即目标识别（GR），在目标众多且不断变化的动态环境中提出了重大挑战。传统的GR方法，针对预定义的目标集，往往难以适应这些动态场景。为了解决这一局限，我们提出了通用动态GR问题——一种更广泛的GR定义——旨在使实时GR系统成为可能，并进一步推动该领域的研究。在此基础上，本文采用一种无模型的目标条件强化学习方法，使GR在各种变化的任务中能够快速适应。