LLM2D

摘要

arXiv:2505.07087v1 宣告类型: 新作摘要: 人工智能（和超人工智能）的一个目标是识别和理解足以实现一般智能的具体机制和表示。通常，这项工作体现在针对架构的研究上，AI/AGI 中已经探索了许多认知架构。然而，不同的研究小组甚至不同的研究传统在一定程度上独立地识别出了相似或常见的过程和表示模式或认知设计模式，这些模式在现有的架构中有所体现。今天，利用大型语言模型（LLMs）的 AI 系统提供了一种相对较新的机制和表示方式，用于探索一般智能的可能性。在本文中，我们总结了几种在各种预转子注意力 AI 架构中反复出现的认知设计模式。然后进一步探讨这些模式在使用 LLMs 的系统中是如何显现的，特别是在进行推理和交互（“能动的”）应用场景方面。通过研究和应用这些反复出现的模式，我们还可以预测当前的能动 LLM 系统中的缺陷或不足之处，并确定未来利用 LLMs 和其他生成性基础模型进行一般智能研究的重点领域。