LLM2D
仅从动作轨迹学习提升的STRIPS模型:一种简单、通用且可扩展的解决方案
Learning Lifted STRIPS Models from Action Traces Alone: A Simple, General, and Scalable Solution
作者: Jonas G\"osgens, Niklas Jansen, Hector Geffner
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14995v1

摘要

仅从动作轨迹学习 STRIPS 动作模型是一个具有挑战性的问题,因为它也涉及学习领域谓词。这项工作引入了一种新方法,它像著名的 LOCM 系统一样具有可扩展性,但像 SAT 方法一样,是健全且完整的。此外,该方法是通用的,并且不对隐藏域或谓词的数量或元数施加任何限制。这种新的学习方法基于一种**高效的新型测试**,该测试检查假设一个谓词受一组动作模式(即具有特定参数位置的动作)的影响是否与轨迹一致。通过测试的谓词和动作模式为学习的领域提供了基础,然后可以很容易地用先决条件和静态谓词来完成它。对这种新方法进行了理论和实验研究。对于后者,该方法在从 8 数码难题等标准经典领域获得的轨迹和图上进行了评估,这些领域涉及数十万个状态和转换。然后在更大的实例上验证学习到的表示。