LLM2D
TRANSIC:通过在线校正学习实现仿真到现实的策略迁移
TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2405.10315v2

摘要

模拟学习并将所学策略转移到现实世界中,具有实现通用机器人的潜力。这种方法的关键挑战在于解决模拟到现实(sim-to-real)的差距。以往的方法通常需要先验的领域特定知识。我们认为,获取此类知识的直接方式是让人类在现实世界中观察并协助机器人策略执行。机器人随后可以通过向人类学习来缩小各种模拟到现实的差距。我们提出了TRANSIC,一种基于人在回路框架的数据驱动方法,以实现成功的模拟到现实转移。TRANSIC允许人类通过干预和在线修正来增强模拟策略,从而全面克服各种未建模的模拟到现实差距。残差策略可以从人类的修正中学习,并与模拟策略集成以实现自主执行。我们展示了我们的方法可以在复杂的接触丰富的操作任务(如家具组装)中实现成功的模拟到现实转移。通过模拟中学习的策略与人类策略的协同整合,TRANSIC作为一种全面的方法,能够有效应对各种常常并存的模拟到现实差距。它展示了与人类努力相适应的扩展性等吸引人的特性。视频和代码可在https://transic-robot.github.io/获取。