摘要
深度强化学习(DRL)在模拟领域展示了显著的成功,然而其在设计机器人控制器方面的应用仍然有限,这主要归因于其单一任务导向以及对环境变化适应性不足。为了克服这些限制,我们提出了一种新颖的自适应代理,该代理利用迁移学习技术,以动态适应不同任务和环境条件下的策略。该方法通过飞艇控制挑战进行了验证,其中多任务能力和环境适应性至关重要。代理使用基于IsaacGym构建的自定义、高度并行化的模拟器进行训练。我们实现了零样本迁移,在现实世界中操控飞艇以解决各种任务。我们的代码可在https://github.com/robot-perception-group/adaptive_agent获取。