LLM2D
房间里的巨象:揭示奖励模型质量对对齐的影响
Elephant in the Room: Unveiling the Impact of Reward Model Quality in Alignment
作者: Yan Liu, Xiaoyuan Yi, Xiaokang Chen, Jing Yao, Jingwei Yi, Daoguang Zan, Zheng Liu, Xing Xie, Tsung-Yi Ho
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19024v1

摘要

大型语言模型(LLM)在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别(NER)中,现有的基于 LLM 的方法...