LLM2D
基于语言特征改进LLM驱动的自动作文评分
Improve LLM-based Automatic Essay Scoring with Linguistic Features
作者: Zhaoyi Joey Hou, Alejandro Ciuba, Xiang Lorraine Li
发布日期: 2/14/2025
arXiv ID: oai:arXiv.org:2502.09497v1

摘要

arXiv:2502.09497v1 类别: cross 摘要: 自动作文评分(AES)为学生作文打分,减轻了教师的评分负担。由于写作任务的灵活性和多样性,开发一个能够处理多样性主题作文的评分系统颇具挑战性。现有的方法通常分为两类:监督特征基方法和大型语言模型(LLM)基方法。监督特征基方法通常能实现更高的性能,但需要资源密集型的训练。相比之下,LLM基方法在推理过程中计算效率较高,但往往会表现为较低的性能。本文通过将语言特征融入到LLM基评分系统中,结合了这两种方法。实验结果表明,这种混合方法在领域内和领域外写作提示下都优于基准模型。