LLM2D
Home
Arxiv
返回列表
强化学习:全面综述
Reinforcement Learning: A Comprehensive Overview
作者:
Kevin Murphy
发布日期:
3/25/2025
arXiv ID:
oai:arXiv.org:2412.05265v2
摘要
arXiv:2412.05265v2 宣告类型: 替换 摘要: 本手稿提供了深度强化学习和顺序决策领域的大纲式、实时综述,涵盖了基于值的方法、策略梯度方法、基于模型的方法以及各种其他主题(例如多智能体强化学习、强化学习与大型语言模型以及强化学习与推理)。
查看原文
下载 PDF