LLM2D
作文评分背后的理由:通过由LLM生成的解析增强S-LLM的多维度作文评分
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs
作者: SeongYeub Chu, JongWoo Kim, Bryan Wong, MunYong Yi
发布日期: 2/5/2025
arXiv ID: 2410.14202

摘要

arXiv:2410.14202v2 宣告类型: 替换交叉 摘要:现有的自动作文评分(AES)方法仅依赖于作文文本而不使用评分解释性理由,从而丧失了捕捉评分标准指示器所评估的具体方面的细粒度机会。本文介绍了基于解释性理由的多项特质评分(Rational-based Multiple Trait Scoring, RMTS),这是一种结合基于提示工程的大型语言模型(Large Language Models, LLMs)和使用小型LLM进行微调的作文评分模型的新型多项特质作文评分方法。RMTS采用基于LLM的特质级理由生成系统,其中独立的LLM代理根据评分标准指南生成特定于特质的理由,评分模型利用这些理由准确预测多项特质评分。在包括ASAP、ASAP++和Feedback Prize在内的基准数据集上的广泛实验表明,RMTS在特质特定评分方面显著优于最先进的模型和纯S-LLMs。通过使用细粒度的定性理由辅助定量评估,RMTS增强了特质级可靠性,并提供了一些关于作文的解释。代码可在 https://github.com/BBeeChu/RMTS.git 获取。