摘要
arXiv:2306.12654v2 宣布类型: 替换
摘要:在现实世界环境中运行的自主代理经常依赖于自动规划器来确定达到期望目标的最佳行动或优化特定的目标函数。这些代理中包含一些常见的架构组件,如调度器,负责确定执行计划行动的时间,以及执行引擎,负责执行这些计划的行动,同时监控其结果。当环境内部出现意外现象,称为“新颖性”,这些现象改变了环境的基本特性、组成和动态时,就会出现一个重要的挑战。这种挑战存在于所有部署的现实世界应用程序中,并且可能会突然出现,而事先没有通知或解释。环境中的新颖性可以导致规划器内部模型中的不准确性,从而使之前生成的计划变得过时。最近的研究引入了旨在检测和适应这类新颖性的代理设计。然而,这些设计缺乏在连续时间空间中的行动调度、多代理间的并发行动协调以及基于记忆的新颖性适应的考虑。此外,该应用主要在低保真环境中进行了演示。在我们的研究中,我们提出了一种通用的AI代理框架,旨在检测、表征和适应高度嘈杂、复杂和随机环境中的新颖性,这些环境支持并发行动和外部调度。我们通过在现实军事场景的高保真模拟器中进行实验展示了我们代理的有效性。