LLM2D
基于语言游戏的无限苏格拉底式学习
Boundless Socratic Learning with Language Games
作者: Tom Schaul
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.16905v1

摘要

在一个封闭系统中训练的智能体,只要满足以下三个条件,就能掌握任何所需的能力:(a) 它接收足够信息丰富且一致的反馈;(b) 它拥有的经验/数据覆盖面足够广;(c) 它拥有足够的容量和资源。本文档中,我们论证了这些条件,并在假设 (c) 不是瓶颈的情况下,考虑了 (a) 和 (b) 在封闭系统中带来的局限性。考虑到输入和输出空间匹配的智能体(即语言)的特殊情况,我们认为这种纯粹的递归自我改进,我们称之为“苏格拉底学习”,可以将性能提升到远远超出其初始数据或知识的水平,并且仅受时间以及逐渐出现的错位问题的限制。此外,我们基于语言游戏的概念,提出了一个具体的实施框架。