LLM2D
使用生成对抗补全网络的生成数据补全方法用于稀疏学习者绩效数据的填充
Generative Data Imputation for Sparse Learner Performance Data Using Generative Adversarial Imputation Networks
作者: Liang Zhang, Jionghao Lin, John Sabatini, Diego Zapata-Rivera, Carol Forsyth, Yang Jiang, John Hollander, Xiangen Hu, Arthur C. Graesser
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.18982v1

摘要

arXiv:2503.18982v1 通告类型: cross 摘要: 智能辅导系统(ITSs)收集的学员表现数据,例如回答问题的响应,对于建模和预测学员的知识状态至关重要。然而,由于跳过或不完整的尝试而导致的缺失响应会创建数据稀疏性,这给准确评估和个性化指导带来了挑战。为了解决这个问题,我们提出了一种生成性填充方法,使用生成对抗填充网络(GAIN)。我们的方法采用了三维(3D)框架(学习者、问题和尝试),灵活地适应了各种稀疏性水平。通过卷积神经网络增强,并使用最小二乘损失函数优化,基于GAIN的方法将输入和输出维度对齐到学习者维度的问题-尝试矩阵上。使用来自AutoTutor成人阅读理解(ARC)、ASSISTments和MATHia的数据集进行的广泛实验表明,我们的方法在各种尝试情境下的填充准确性显著优于张量分解和替代的GAN方法。进一步通过贝叶斯知识追踪(BKT)验证了填充数据的有效性,通过估计学习参数(初始知识P(L0)、学习速率P(T)、猜测率P(G)、滑动率P(S)),证明了填充数据能够提高模型拟合度,紧密反映了原始分布,可靠捕捉了潜在的学习行为。Kullback-Leibler(KL)散度评估证实了最小的散度差距,表明填充数据有效地保留了关键的学习特征。这些发现强调了GAIN作为ITSs中稳健的填充工具的能力,缓解了数据稀疏性,并支持适应性的个性化指导,最终导致更精确和响应性的学员评估,并改善了教育成果。