摘要
仅从动作轨迹学习 STRIPS 动作模型是一个具有挑战性的问题,因为它也涉及学习领域谓词。这项工作引入了一种新方法,它像著名的 LOCM 系统一样具有可扩展性,但像 SAT 方法一样,是健全且完整的。此外,该方法是通用的,并且不对隐藏域或谓词的数量或元数施加任何限制。这种新的学习方法基于一种**高效的新型测试**,该测试检查假设一个谓词受一组动作模式(即具有特定参数位置的动作)的影响是否与轨迹一致。通过测试的谓词和动作模式为学习的领域提供了基础,然后可以很容易地用先决条件和静态谓词来完成它。对这种新方法进行了理论和实验研究。对于后者,该方法在从 8 数码难题等标准经典领域获得的轨迹和图上进行了评估,这些领域涉及数十万个状态和转换。然后在更大的实例上验证学习到的表示。