LLM2D

摘要

arXiv:2410.14202v3 宣布类型: replace-cross 摘要：现有的自动作文评分(AES)方法仅依赖于作文文本，而未使用解释性理由来生成分数，因此错过了在细微程度上捕捉评分标准指标评估的具体方面的机会。本文引入了基于解释性理由的多特质评分(RMTS)，这是一种将基于提示工程的大语言模型(LLM)与基于微调的小型大语言模型(S-LLM)结合进作文评分模型的新方法。RMTS使用基于LLM的特质特定理由生成系统，其中专门的LLM代理根据评分标准指南生成特定于特质的理由，评分模型使用这些理由来精确预测多特质评分。在基准数据集ASAP、ASAP++和Feedback Prize上的广泛实验表明，RMTS在特质检分方面显著优于最先进的模型和原始S-LLM。通过使用细粒度的定性理由辅助定量评估，RMTS增强了特质检分的可靠性，提供了对作文的部分解释。代码可在 https://github.com/BBeeChu/RMTS.git 获取。