摘要
arXiv:2504.10831v1 安全公告类型: 新
摘要: 本文提出了一种双层框架 SafeGPT,该框架将生成预训练变换器(GPTs)与强化学习(RL)相结合,以实现高效可靠的无人驾驶航空车辆(UAV)最后一英里的配送。在所提出的设计中,全局 GPT 模块分配高层任务,如区域分配,而 On-Device GPT 管理实时局部路线规划。基于 RL 的安全过滤器监控每个 GPT 的决策,并在有可能导致电池耗尽或重复访问时取代不安全的行为,从而有效地缓解幻觉现象。此外,双重重播缓冲机制有助于改进 GPT 模块和 RL 代理的策略。仿真结果表明,与仅使用 GPT 的基线相比,SafeGPT 在提高配送成功率的同时,显著降低了电池消耗和行驶距离。这些发现验证了结合基于 GPT 的语义推理与形式安全保证的有效性,为 robust 和 energy-efficient 的 UAV 物流提供了可行的解决方案。