LLM2D
生命,呃,自有出路:系统化神经搜索
Life, uh, Finds a Way: Systematic Neural Search
作者: Alex Baranski, Jun Tani
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2410.01349v1

摘要

我们致力于解决在全新环境中快速调整智能体行为以解决时空连续问题的挑战。动物展现出非凡的适应新环境的能力,这种能力是人工系统无法比拟的。我们没有专注于通过深度强化学习实现泛化,而是提出将行为视为搜索过程的物理表现形式,其中稳健的解决问题的能力源于对所有可能行为的穷举搜索。令人惊讶的是,这可以通过在线修改引导动作的认知图来有效地完成,挑战了在连续空间中穷举搜索不切实际的普遍观点。我们描述了一种算法,该算法通过调节行为执行和图突变之间的紧密反馈循环来隐式枚举行为,并提供了一种基于赫布学习和受内嗅皮层启发的全新高维谐波表示的神经实现。通过将行为定义为搜索,我们提供了一个数学上简单且生物学上合理的实时行为适应模型,成功地解决了各种连续状态空间导航问题。该框架不仅为其他应用提供了灵活的神经基质,而且还为理解适应性行为提供了一个强大的范式。我们的结果表明,在发展性学习和无监督技能获取方面可能取得进展,为自主机器人掌握复杂技能铺平道路,这些技能需要在数据稀疏的环境中灵活运用。