LLM2D

摘要

arXiv:2402.10726v3 宣告类型: 替换摘要: 前述从状态轨迹学习的STRIPS领域模型获取方法从要学习的动作的名称和参数开始。因此，它们的任务仅仅是推断给定动作的先件和结果。在本项工作中，我们探讨了当学习的动作参数未提供时的学习情况。我们基于所提供的信息定义了两种轨迹质量级别，并为此每种情况提供了一个算法。在一种级别（L1）中，轨迹中的状态标记有动作名称，因此我们可以推断出动作的数量和名称，但仍需确定参数的数量和类型。在另一种级别（L2）中，状态还标记有构成相应接地动作参数的物体。在此情况下，我们仍需推断学习动作的参数类型。我们在一个大型IPC基准集合上实验性地评估了提出的方法，并将其与最先进的学习工具FAMA进行了比较。评估结果显示，我们新的算法更快，能处理更大的输入，并在学习动作模型方面提供了更好的结果，使其更为接近参考模型。