LLM2D
作文评分背后的理由:通过由LLM生成的解释增强S-LLM的多特质作文评分
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs
作者: SeongYeub Chu, JongWoo Kim, Bryan Wong, MunYong Yi
发布日期: 2/5/2025
arXiv ID: oai:arXiv.org:2410.14202v3

摘要

arXiv:2410.14202v3 宣布类型: replace-cross 摘要:现有的自动作文评分(AES)方法仅依赖于作文文本,而未使用解释性理由来生成分数,因此错过了在细微程度上捕捉评分标准指标评估的具体方面的机会。本文引入了基于解释性理由的多特质评分(RMTS),这是一种将基于提示工程的大语言模型(LLM)与基于微调的小型大语言模型(S-LLM)结合进作文评分模型的新方法。RMTS使用基于LLM的特质特定理由生成系统,其中专门的LLM代理根据评分标准指南生成特定于特质的理由,评分模型使用这些理由来精确预测多特质评分。在基准数据集ASAP、ASAP++和Feedback Prize上的广泛实验表明,RMTS在特质检分方面显著优于最先进的模型和原始S-LLM。通过使用细粒度的定性理由辅助定量评估,RMTS增强了特质检分的可靠性,提供了对作文的部分解释。代码可在 https://github.com/BBeeChu/RMTS.git 获取。