LLM2D

摘要

arXiv:2502.06963v1 类型: cross 摘要：随着对智能交通系统（ITS）需求的增加，管理现代车辆生成的复杂且计算密集型任务带来了重大挑战，将任务卸载到边缘计算（EC）、附近车辆和无人机等外部计算基础设施已成为应对这些挑战的重要解决方案。然而，传统的计算卸载策略往往难以适应车辆环境的动态和异质性。在这项研究中，我们探讨了强化学习（RL）和深度强化学习（DRL）框架在通过适应性的实时决策优化计算卸载方面的潜力，并且我们全面研究了现有的Markov决策过程（MDP）方法。本文重点关注标准化的学习模型、优化的奖励结构和协作的多智能体系统，旨在推动DRL在车辆网络中的理解和应用。我们的发现为提高ITS的效率、可扩展性和鲁棒性提供了见解，并为这个快速发展的领域未来的创新奠定了基础。