LLM2D

摘要

arXiv:2501.18924v1 Announce Type: 新摘要：大型语言模型（LLMs）向人工超人类智能（ASI）的演变依赖于数据再现这一循环过程，在此过程中，模型生成、整理并重新训练于新颖数据，以完善其能力。然而，当前的方法存在陷入数据再现陷阱的风险：在固定的人类生成的数据分布中形成闭环优化输出，会导致停滞不前，因为模型只是重新组合现有的知识，而不是探索新的前沿领域。在本文中，我们提出了语言游戏作为一种扩展数据再现的途径，通过三种机制打破这一循环：（1）**角色流动性**，通过多Agent系统在任务间动态调整角色，增强数据的多样性和覆盖率；（2）**奖励多样性**，嵌入多种反馈标准，以驱动复杂智能行为；以及（3）**规则可塑性**，迭代进化交互约束，以促进学习能力，从而注入持续的创新。通过将语言游戏扩展到全球社会技术生态系统中，人机共生进化生成无限的数据流，推动开放式探索。这种框架重新定义了数据再现，不再是一个封闭的循环，而是一个推动超人类智能的动力引擎。