LLM2D
Home
Arxiv
返回列表
房间里的巨象:揭示奖励模型质量对对齐的影响
Elephant in the Room: Unveiling the Impact of Reward Model Quality in Alignment
作者:
Yan Liu, Xiaoyuan Yi, Xiaokang Chen, Jing Yao, Jingwei Yi, Daoguang Zan, Zheng Liu, Xing Xie, Tsung-Yi Ho
发布日期:
10/1/2024
arXiv ID:
oai:arXiv.org:2409.19024v1
摘要
大型语言模型(LLM)在许多自然语言处理任务中取代了传统方法。然而,在命名实体识别(NER)中,现有的基于 LLM 的方法...
查看原文
下载 PDF