摘要
arXiv:2504.21013v1 交叉公告类型:
摘要:人工智能(AI)生成的反馈在教育环境中的应用引起了广泛关注,因为它有潜力提升学习效果。然而,关于AI生成反馈的语义特征,包括可读性、词汇丰富性和不同挑战水平下的适应性,的全面理解仍然有限。本研究深入探讨了Google的Gemini 1.5-flash文本模型生成的计算机科学多项选择题(MCQ)反馈的语义和结构特征。分析了超过1,200个MCQ,考虑了三个难度级别(简单、中等、困难)和三种反馈语气(支持性、中性、挑战性)。计算并分析了诸如长度、可读性评分(Flesch-Kincaid 年级水平)、词汇丰富性和词汇密度等关键语义指标。使用微调的基于RoBERTa的多任务学习(MTL)模型来预测这些语义属性,可读性误差的平均绝对误差(MAE)为2.0,词汇丰富性的误差为0.03。研究结果揭示了反馈语气与问题难度之间的显着相互作用,表明AI生成反馈在不同教育背景下的动态适应能力。这些见解有助于开发更加个性化和有效的AI驱动反馈机制,强调了在其设计和部署中考虑伦理问题的潜在重要性,有可能改善学习成果。