LLM2D

摘要

arXiv:2503.11711v2 宣布类型: replace-cross 摘要：数据隐私仍然是教育研究中的一个重要关切，需要严格遵守伦理标准和监管程序。虽然传统方法依赖于匿名化和集中式数据收集，但它们往往将敏感的学生数据暴露给安全漏洞，并且产生了巨大的物流负担。在本研究中，我们提出了一种联邦学习（FL）框架，用于自动化教育评估评分，从而消除在各机构之间共享敏感数据的需要。我们的方法利用低秩适应（LoRA）高效参数微调大规模语言模型（LLMs），使每个客户端（学校）能够本地训练模型，而只需共享优化的模型更新。为解决数据异质性问题，我们实现了一种适应加权聚合策略，该策略综合考虑了客户端性能和数据量。我们使用九所中学的NGSS对齐的多标签科学评估数据，将我们的模型与两种最先进的FL方法和集中式学习基线进行了对比测试。结果显示，我们的模型在FL方法中的准确率最高（94.5%），在这些指标上与集中式模型的差距在0.5-1.0个百分点之间。此外，它在评分标准级别上达到了相当准确的评分准确率，标尺匹配差异仅为1.3%，并且具有较低的得分偏差（MAE），这突显了它在保持预测质量和可解释性方面的效果。