LLM2D
基于不确定性感知主动学习的人类偏好景观的户外多机器人反应式导航
Reactive Multi-Robot Navigation in Outdoor Environments Through Uncertainty-Aware Active Learning of Human Preference Landscape
作者: Chao Huang, Wenshuo Zang, Carlo Pinciroli, Zhi Jane Li, Taposh Banerjee, Lili Su, Rui Liu
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16577v1

摘要

与单一机器人相比,多机器人系统 (MRS) 由于拥有多个具有不同能力的成员,可以更有效地执行任务。然而,由于存在不确定性和各种障碍物(例如,建筑群和树木),在广阔的现实世界环境中部署 MRS 仍然具有挑战性。由于对环境不确定性对性能的了解有限,MRS 无法灵活地调整其行为(例如,团队合作、负载共享、轨迹规划),以确保环境适应和任务完成。在这项工作中,设计了一种新颖的联合偏好景观学习和行为调整框架 (PLBA)。PLBA 有效地将实时的人类引导整合到 MRS 协调中,并利用具有可变输出噪声的稀疏变分高斯过程,通过利用环境特征之间的空间相关性来快速评估人类偏好。然后,一种基于优化的行为调整方法安全地将 MRS 行为适应环境。为了验证 PLBA 在 MRS 行为适应中的有效性,设计了洪水灾害搜救任务。20 位人类用户根据从 MRS 行为中获得的人类偏好提供了 1764 条反馈,这些偏好与“任务质量”、“任务进度”、“机器人安全”有关。预测准确率和适应速度结果表明 PLBA 在偏好学习和 MRS 行为适应方面的有效性。