LLM2D
连续思维机器
Continuous Thought Machines
作者: Luke Darlow, Ciaran Regan, Sebastian Risi, Jeffrey Seely, Llion Jones
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.05522v2

摘要

arXiv:2505.05522v2 通知类型: 替换-交叉 摘要:生物大脑展示了复杂的神经活动,其中神经元之间的时间关系和相互作用对大脑处理信息至关重要。大多数深度学习架构通过抽象掉时间动态来简化神经活动。在本文中,我们挑战了这种范式。通过整合神经元级别的处理和同步,我们可以有效地重新引入神经时间作为基础元素。我们提出了连续思维机器(CTM),一种设计用于利用神经动力学作为其核心表示的模型。CTM的核心创新有两项:(1)神经元级别的时间处理,其中每个神经元使用独特的权重参数处理传入信号的历史;(2)作为一种潜在表示的神经元同步。CTM旨在在简化神经元抽象以提高计算效率和生物现实之间取得平衡。它在有效的捕捉关键时间动态的同时,保持计算上可行以适应深度学习。我们展示了CTM在一系列具有挑战性的任务中表现出强劲的性能和 versatility,包括ImageNet-1K分类、解决2D迷宫、排序、奇偶性计算、问答和强化学习任务。除了展示丰富的内部表示并因其内部过程提供自然的可解释性途径外,CTM还能够执行需要复杂顺序推理的任务。CTM还可以利用自适应计算,在简单任务中可以提前停止,而在面对更具有挑战性的实例时继续计算。本工作的目标是分享CTM及其相关创新,而不是推动新的最先进成果。为了这一目标,我们认为CTM代表了一步向开发更生物合现实且强大的人工智能系统的显著进展。