LLM2D

摘要

arXiv:2504.14751v1 类型: cross 摘要: 在过去几十年中，人工智能在“特定能力”方面取得了诸多成功，这类能力被称为闭世界，例如人工环境或特定的实际任务。这种明确界定的狭义能力带来了两个优点：明确的成功标准以及大量案例的收集机会。这些标准不仅揭示了机器是否实现了目标，而且还揭示了机器在实现目标方面存在哪些不足。结果，人类设计者可以一个接一个地修复这些问题，直到机器被认为足够好以完成任务。此外，收集到的大量案例较少降低了这一问题修复过程的难度（通过中心极限定理）。闭世界的成功能否转化为广泛开放世界中的成功，在开放世界中，机器需要在较少的示例和较少的人类设计者先验知识的情况下完成任何人类可以完成的任务？不，并非如此。因为特定任务的熟练程度对处理其他任务的洞察甚微，专门任务的价值标准在处理更广泛的未知任务时变得无用。此外，由于未知任务缺少案例，中心极限定理对我们不利。最终，人类设计者失去了调试开放世界中AI系统的“指南针”。为了实现开放世界的人工智能，需要独特的学习原则和创新的技术，这些原则和技术与构建闭世界人工智能的原则和方法不同。本文探讨了用于构建开放世界人工智能所需的学习原则，包括丰富的特征（如大型工具箱）、去卷积表示（如有序的工具箱）和推理时学习（如擅长使用工具的手）。受学习原则的驱动，本文还提出了应用这些学习原则的技术，并进行了大量大规模实验来验证这些学习原则。