LLM2D

摘要

在一个封闭系统中训练的智能体，只要满足以下三个条件，就能掌握任何所需的能力：(a) 它接收足够信息丰富且一致的反馈；(b) 它拥有的经验/数据覆盖面足够广；(c) 它拥有足够的容量和资源。本文档中，我们论证了这些条件，并在假设 (c) 不是瓶颈的情况下，考虑了 (a) 和 (b) 在封闭系统中带来的局限性。考虑到输入和输出空间匹配的智能体（即语言）的特殊情况，我们认为这种纯粹的递归自我改进，我们称之为“苏格拉底学习”，可以将性能提升到远远超出其初始数据或知识的水平，并且仅受时间以及逐渐出现的错位问题的限制。此外，我们基于语言游戏的概念，提出了一个具体的实施框架。