LLM2D

摘要

arXiv:2504.15129v1 交叉公告类型：摘要：将机器人学习方法部署到未结构化的户外环境中进行四旋翼飞行器是一个令人兴奋的任务。使用基于学习的方法在现实环境中操作四旋翼飞行器遇到了几个挑战：大量由模拟器生成的数据用于训练，严格的实时处理需求，以及由于动态和嘈杂的条件引起的模拟到现实的差距。当前的工作在将基于学习的方法应用于四旋翼飞行器的端到端控制方面取得了巨大突破，但很少提到从零开始训练基础设施系统并部署到现实中的问题，这使得难以再现方法和应用。为了弥合这一差距，我们提出一个平台，使端到端的深度强化学习(DRL)策略能够无缝转移。我们整合了训练环境、飞行动力控制、DRL算法、MAVROS中间件堆栈和硬件，形成一个全面的工作流和架构，能够使四旋翼飞行器的策略从零开始训练到几分钟内的现实世界部署。我们的平台提供包括悬停、动态障碍物规避、轨迹跟踪、击打气球和未知环境规划等多种类型的环境，作为物理实验基准。通过广泛的实证验证，我们展示了所提出模拟到现实平台的效率，并在现实世界干扰下的稳健户外飞行性能。更多信息可从我们的网站https://emnavi.tech/AirGym/获取。