LLM2D

摘要

arXiv:2504.21013v1 交叉公告类型: 摘要：人工智能（AI）生成的反馈在教育环境中的应用引起了广泛关注，因为它有潜力提升学习效果。然而，关于AI生成反馈的语义特征，包括可读性、词汇丰富性和不同挑战水平下的适应性，的全面理解仍然有限。本研究深入探讨了Google的Gemini 1.5-flash文本模型生成的计算机科学多项选择题（MCQ）反馈的语义和结构特征。分析了超过1,200个MCQ，考虑了三个难度级别（简单、中等、困难）和三种反馈语气（支持性、中性、挑战性）。计算并分析了诸如长度、可读性评分（Flesch-Kincaid 年级水平）、词汇丰富性和词汇密度等关键语义指标。使用微调的基于RoBERTa的多任务学习（MTL）模型来预测这些语义属性，可读性误差的平均绝对误差（MAE）为2.0，词汇丰富性的误差为0.03。研究结果揭示了反馈语气与问题难度之间的显着相互作用，表明AI生成反馈在不同教育背景下的动态适应能力。这些见解有助于开发更加个性化和有效的AI驱动反馈机制，强调了在其设计和部署中考虑伦理问题的潜在重要性，有可能改善学习成果。