LLM2D

摘要

与单一机器人相比，多机器人系统 (MRS) 由于拥有多个具有不同能力的成员，可以更有效地执行任务。然而，由于存在不确定性和各种障碍物（例如，建筑群和树木），在广阔的现实世界环境中部署 MRS 仍然具有挑战性。由于对环境不确定性对性能的了解有限，MRS 无法灵活地调整其行为（例如，团队合作、负载共享、轨迹规划），以确保环境适应和任务完成。在这项工作中，设计了一种新颖的联合偏好景观学习和行为调整框架 (PLBA)。PLBA 有效地将实时的人类引导整合到 MRS 协调中，并利用具有可变输出噪声的稀疏变分高斯过程，通过利用环境特征之间的空间相关性来快速评估人类偏好。然后，一种基于优化的行为调整方法安全地将 MRS 行为适应环境。为了验证 PLBA 在 MRS 行为适应中的有效性，设计了洪水灾害搜救任务。20 位人类用户根据从 MRS 行为中获得的人类偏好提供了 1764 条反馈，这些偏好与“任务质量”、“任务进度”、“机器人安全”有关。预测准确率和适应速度结果表明 PLBA 在偏好学习和 MRS 行为适应方面的有效性。