摘要
arXiv:2503.11711v2 宣布类型: replace-cross
摘要:数据隐私仍然是教育研究中的一个重要关切,需要严格遵守伦理标准和监管程序。虽然传统方法依赖于匿名化和集中式数据收集,但它们往往将敏感的学生数据暴露给安全漏洞,并且产生了巨大的物流负担。在本研究中,我们提出了一种联邦学习(FL)框架,用于自动化教育评估评分,从而消除在各机构之间共享敏感数据的需要。我们的方法利用低秩适应(LoRA)高效参数微调大规模语言模型(LLMs),使每个客户端(学校)能够本地训练模型,而只需共享优化的模型更新。为解决数据异质性问题,我们实现了一种适应加权聚合策略,该策略综合考虑了客户端性能和数据量。我们使用九所中学的NGSS对齐的多标签科学评估数据,将我们的模型与两种最先进的FL方法和集中式学习基线进行了对比测试。结果显示,我们的模型在FL方法中的准确率最高(94.5%),在这些指标上与集中式模型的差距在0.5-1.0个百分点之间。此外,它在评分标准级别上达到了相当准确的评分准确率,标尺匹配差异仅为1.3%,并且具有较低的得分偏差(MAE),这突显了它在保持预测质量和可解释性方面的效果。