LLM2D

摘要

arXiv:2504.10831v1 安全公告类型: 新摘要: 本文提出了一种双层框架 SafeGPT，该框架将生成预训练变换器（GPTs）与强化学习（RL）相结合，以实现高效可靠的无人驾驶航空车辆（UAV）最后一英里的配送。在所提出的设计中，全局 GPT 模块分配高层任务，如区域分配，而 On-Device GPT 管理实时局部路线规划。基于 RL 的安全过滤器监控每个 GPT 的决策，并在有可能导致电池耗尽或重复访问时取代不安全的行为，从而有效地缓解幻觉现象。此外，双重重播缓冲机制有助于改进 GPT 模块和 RL 代理的策略。仿真结果表明，与仅使用 GPT 的基线相比，SafeGPT 在提高配送成功率的同时，显著降低了电池消耗和行驶距离。这些发现验证了结合基于 GPT 的语义推理与形式安全保证的有效性，为 robust 和 energy-efficient 的 UAV 物流提供了可行的解决方案。