摘要
arXiv:2501.18924v1 Announce Type: 新
摘要:大型语言模型(LLMs)向人工超人类智能(ASI)的演变依赖于数据再现这一循环过程,在此过程中,模型生成、整理并重新训练于新颖数据,以完善其能力。然而,当前的方法存在陷入数据再现陷阱的风险:在固定的人类生成的数据分布中形成闭环优化输出,会导致停滞不前,因为模型只是重新组合现有的知识,而不是探索新的前沿领域。在本文中,我们提出了语言游戏作为一种扩展数据再现的途径,通过三种机制打破这一循环:(1)**角色流动性**,通过多Agent系统在任务间动态调整角色,增强数据的多样性和覆盖率;(2)**奖励多样性**,嵌入多种反馈标准,以驱动复杂智能行为;以及(3)**规则可塑性**,迭代进化交互约束,以促进学习能力,从而注入持续的创新。通过将语言游戏扩展到全球社会技术生态系统中,人机共生进化生成无限的数据流,推动开放式探索。这种框架重新定义了数据再现,不再是一个封闭的循环,而是一个推动超人类智能的动力引擎。