摘要
arXiv:2504.12497v1 类型: 新
摘要: 即使在过去的训练中已经学习过,一个在开放世界中的智能体也会面临之前的经验、现有模型或策略之外的不熟悉的情况和事件。此外,智能体有时会缺乏相关的知识和/或足够的时间来评估当前情况、生成和评估选择方案,并采取一个经过深思熟虑的行动计划。智能体如何合理地应对超出其原始设计范围的情况?它如何足够快速和可靠地识别这些情况,以确定合理的、适应性的行动计划?我们确定了所需的关键特征,并根据这些要求评估了现有的方法,提出了一种新的方法来结合一般领域的元知识(以受人类认知启发的评估形式)和元推理。这种方法有可能提供对不熟悉情况的快速、适应性的响应,更加全面地满足开放世界和通用智能体所需的性能特征。