LLM2D

摘要

arXiv:2502.09497v1 类别: cross 摘要: 自动作文评分（AES）为学生作文打分，减轻了教师的评分负担。由于写作任务的灵活性和多样性，开发一个能够处理多样性主题作文的评分系统颇具挑战性。现有的方法通常分为两类：监督特征基方法和大型语言模型（LLM）基方法。监督特征基方法通常能实现更高的性能，但需要资源密集型的训练。相比之下，LLM基方法在推理过程中计算效率较高，但往往会表现为较低的性能。本文通过将语言特征融入到LLM基评分系统中，结合了这两种方法。实验结果表明，这种混合方法在领域内和领域外写作提示下都优于基准模型。