LLM2D
全面的奖励模型综述:分类、应用、挑战和未来
A Comprehensive Survey of Reward Models: Taxonomy, Applications, Challenges, and Future
作者: Jialun Zhong, Wei Shen, Yanzeng Li, Songyang Gao, Hua Lu, Yicheng Chen, Yang Zhang, Wei Zhou, Jinjie Gu, Lei Zou
发布日期: 4/18/2025
arXiv ID: oai:arXiv.org:2504.12328v1

摘要

arXiv:2504.12328v1 宣告类型: cross 摘要:奖励模型(RM)在增强大型语言模型(LLM)方面展示了令人印象深刻的潜力,因为RM可以作为人类偏好的代理,为LLM在各种任务中的行为提供指导信号。在本文中,我们从偏好收集、奖励建模和应用的角度提供了对相关研究的全面概述。接下来,我们介绍了奖励模型的应用,并讨论了评估基准。此外,我们深入分析了该领域存在的挑战,并探讨了潜在的研究方向。本文旨在为初学者提供对奖励模型的全面介绍,并促进未来的研究所用的资源可在GitHub上公开获取<footnote>https://github.com/JLZhong23/awesome-reward-models</footnote>。