LLM2D

摘要

开放式和人工智能生成的算法旨在无限期地持续生成和解决日益复杂的任务，为实现更通用的人工智能提供了一条有希望的途径。为了实现这一宏伟愿景，学习必须发生在大量的潜在任务中。现有的自动生成环境的方法局限于人工预定义的、通常范围狭窄的环境分布，限制了它们创建任何学习环境的能力。为了解决这一限制，我们引入了一个新的框架OMNI-EPIC，它通过人类趣味概念模型（OMNI）和代码编程环境（EPIC）增强了先前在开放性方面的研究。OMNI-EPIC利用基础模型自主生成代码，指定下一个可学习的（即，对于智能体的当前技能水平来说既不太容易也不太难）且有趣（例如，有价值和新颖的）任务。OMNI-EPIC生成环境（例如，障碍课程）和奖励函数（例如，快速通过障碍课程而不接触红色物体），原则上使其能够创建任何可模拟的学习任务。我们展示了OMNI-EPIC惊人的创造力，它不断创新以提出新的、有趣的学习挑战。我们还强调了OMNI-EPIC如何适应强化学习智能体的学习进度，生成难度合适的任务。总的来说，OMNI-EPIC可以无限地创建可学习且有趣的环境，进一步推动自改进人工智能系统和人工智能生成算法的发展。项目网站（含视频）：https://dub.sh/omniepic