LLM2D

摘要

深度强化学习（DRL）在模拟领域展示了显著的成功，然而其在设计机器人控制器方面的应用仍然有限，这主要归因于其单一任务导向以及对环境变化适应性不足。为了克服这些限制，我们提出了一种新颖的自适应代理，该代理利用迁移学习技术，以动态适应不同任务和环境条件下的策略。该方法通过飞艇控制挑战进行了验证，其中多任务能力和环境适应性至关重要。代理使用基于IsaacGym构建的自定义、高度并行化的模拟器进行训练。我们实现了零样本迁移，在现实世界中操控飞艇以解决各种任务。我们的代码可在https://github.com/robot-perception-group/adaptive_agent获取。