摘要
arXiv:2410.14202v2 宣告类型: 替换交叉
摘要:现有的自动作文评分(AES)方法仅依赖于作文文本而不使用评分解释性理由,从而丧失了捕捉评分标准指示器所评估的具体方面的细粒度机会。本文介绍了基于解释性理由的多项特质评分(Rational-based Multiple Trait Scoring, RMTS),这是一种结合基于提示工程的大型语言模型(Large Language Models, LLMs)和使用小型LLM进行微调的作文评分模型的新型多项特质作文评分方法。RMTS采用基于LLM的特质级理由生成系统,其中独立的LLM代理根据评分标准指南生成特定于特质的理由,评分模型利用这些理由准确预测多项特质评分。在包括ASAP、ASAP++和Feedback Prize在内的基准数据集上的广泛实验表明,RMTS在特质特定评分方面显著优于最先进的模型和纯S-LLMs。通过使用细粒度的定性理由辅助定量评估,RMTS增强了特质级可靠性,并提供了一些关于作文的解释。代码可在 https://github.com/BBeeChu/RMTS.git 获取。