LLM2D

摘要

arXiv:2504.12497v1 类型: 新摘要: 即使在过去的训练中已经学习过，一个在开放世界中的智能体也会面临之前的经验、现有模型或策略之外的不熟悉的情况和事件。此外，智能体有时会缺乏相关的知识和/或足够的时间来评估当前情况、生成和评估选择方案，并采取一个经过深思熟虑的行动计划。智能体如何合理地应对超出其原始设计范围的情况？它如何足够快速和可靠地识别这些情况，以确定合理的、适应性的行动计划？我们确定了所需的关键特征，并根据这些要求评估了现有的方法，提出了一种新的方法来结合一般领域的元知识（以受人类认知启发的评估形式）和元推理。这种方法有可能提供对不熟悉情况的快速、适应性的响应，更加全面地满足开放世界和通用智能体所需的性能特征。