LLM2D

摘要

类人机器人可以通过模仿人类来受益于它们与人类形态的相似性。当人类教导其他人如何执行动作时，他们通常会演示这些动作，学习者会模仿演示以了解如何执行动作。能够从第三人称视角的演示中 mentally 转移到第一人称视角的演示，对于人类的这种能力至关重要。由于这是一项具有挑战性的任务，因此通常通过从第一人称视角创建演示来简化机器人。创建这些演示可以更容易地模仿，但需要更多努力。因此，我们引入了一种新颖的扩散模型，该模型使机器人能够直接从第三人称演示中学习，通过学习从第三人称视角生成第一人称视角。该模型在两种视角之间转换物体和环境的大小和旋转。这使我们能够利用易于制作的第三人称演示和易于模仿的第一人称演示的优势。