摘要
本文提出了一种新方法,以解决非平稳、部分可观察环境中不确定性决策下的在线时间记忆学习问题。提出的算法,分布式赫布时间记忆 (DHTM),基于因子图形式和多组分神经元模型。DHTM 旨在捕捉顺序数据关系并对未来观察结果进行累积预测,形成后继特征 (SF)。受新皮层神经生理模型的启发,该算法利用分布式表示、稀疏转移矩阵和局部赫布式学习规则,克服了 RNN 和 HMM 等传统时间记忆算法的不稳定性和学习速度慢的问题。实验结果表明,在非平稳数据集的情况下,DHTM 的性能优于 LSTM 和受生物启发的 HMM 类算法 CSCG。我们的发现表明,DHTM 是一种很有前景的方法,可以解决动态环境中在线序列学习和规划的挑战。