LLM2D
基于Bi-LSTM的多agent深度强化学习与 Awareness 意识修剪的代理双胞胎迁移在车辆具身AI网络中
Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks
作者: Yuxiang Wei, Zhuoqi Zeng, Yue Zhong, Jiawen Kang, Ryan Wen Liu, M. Shamim Hossain
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06378v1

摘要

arXiv:2505.06378v1 类型: cross 摘要: 随着大型语言模型和具身人工智能(AI)在智能交通场景中的发展,它们的结合在智能交通中催生了具身人工智能网络(VEANs)。在VEANs中,自动驾驶车辆(AVs)是典型的代理,其本地高级AI应用被定义为具身人工智能代理,从而具备环境感知和多代理协作的能力。由于计算延迟和资源约束,运行在具身人工智能代理上的本地AI应用和服务需要进行迁移,并随后被称为具身人工智能代理双胞胎,从而推动了具身人工智能网络的发展,通过将密集任务卸载到路边单元(RSUs)来缓解延迟问题,同时保持服务质量。认识到传统方法中RSUs之间的工作负载不平衡,我们将AV-RSU交互建模为Stackelberg博弈,以优化带宽资源分配,实现高效的迁移。我们设计了一种名为Tiny Multi-Agent Bidirectional LSTM Proximal Policy Optimization(TMABLPPO)的算法,通过去中心化协调来近似Stackelberg均衡。此外,我们设计了一种基于路径排除(PX)的个性化神经网络剪枝算法,能够动态适应不同的AV计算能力,通过识别训练模型中的任务关键参数来降低模型复杂性,同时减少性能下降。实验验证证实了该算法在平衡系统负载和最小化延迟方面的有效性,展示了具身人工智能代理部署的重要改进。