摘要
高效的预先规划能力对于生物有机体和人工系统都至关重要。基于模型的规划和预期在认知神经科学和人工智能(AI)领域得到了广泛的研究,但它们是从不同的角度出发——并且目标也不同(生物现实性与可扩展性),难以调和。在这里,我们介绍一种在POMDP中进行规划的新方法——主动推理树搜索(AcT)——它结合了神经科学中领先的规划理论(主动推理)的规范性和生物现实性以及人工智能中树搜索方法的可扩展性。这种统一增强了这两种方法。一方面,树搜索使得基于生物学、第一性原理的主动推理方法能够应用于大规模问题。另一方面,主动推理为探索-利用困境提供了一个有原则的解决方案,而树搜索方法通常以启发式方式解决这个问题。我们的模拟表明,AcT成功地导航了基于采样的方法难以应对的二叉树、需要自适应探索的问题以及大型POMDP问题“RockSample”——其中AcT再现了最先进的POMDP解决方案。此外,我们还说明了如何使用AcT模拟人类和其他动物解决大型规划问题的神经生理反应(例如,在海马体和前额叶皮层中)。这些数值分析表明,主动树搜索是神经科学和人工智能规划理论的有原则的实现,它兼具生物现实性和可扩展性。