LLM2D

房间里的巨象：揭示奖励模型质量对对齐的影响

Elephant in the Room: Unveiling the Impact of Reward Model Quality in Alignment

作者: Yan Liu, Xiaoyuan Yi, Xiaokang Chen, Jing Yao, Jingwei Yi, Daoguang Zan, Zheng Liu, Xing Xie, Tsung-Yi Ho

发布日期: 10/1/2024

arXiv ID: oai:arXiv.org:2409.19024v1

大型语言模型（LLM）在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别（NER）中，现有的基于 LLM 的方法...