LLM2D
基于生成对抗填充网络的生成数据插补方法在稀疏学习者性能数据上的应用
Generative Data Imputation for Sparse Learner Performance Data Using Generative Adversarial Imputation Networks
作者: Liang Zhang, Jionghao Lin, John Sabatini, Diego Zapata-Rivera, Carol Forsyth, Yang Jiang, John Hollander, Xiangen Hu, Arthur C. Graesser
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2503.18982v2

摘要

arXiv:2503.18982v2 通知类型: 替换交叉 摘要:智能辅导系统(ITSs)收集的 learners 表现数据,如问题的回答,对于建模和预测 learners 的知识状态至关重要。然而,由于跳过或不完整的尝试导致的缺失回答造成了数据稀疏性,这使得准确评估和个性化教学变得更具挑战性。为了解决这个问题,我们提出了一种生成插补方法,使用生成对抗插补网络(GAIN)。我们的方法具有三维(3D)框架(learners、questions 和 attempts),能够灵活适应各种稀疏性水平。通过卷积神经网络增强并通过最小二乘损失函数优化,基于 GAIN 的方法将输入和输出维度对齐到 learners 维度上的 question-attempt 矩阵。使用来自 AutoTutor 成人阅读理解(ARC)、ASSISTments 和 MATHia 的数据集进行的广泛实验表明,我们的方法在不同尝试情景下的插补准确性显著优于张量分解和替代 GAN 方法。贝叶斯知识追踪(BKT)进一步通过估计学习参数:初始知识(P(L0))、学习速率(P(T))、猜测率(P(G))和滑动率(P(S)),验证了插补数据的有效性。结果表明,插补数据提高了模型拟合度,紧密反映了原始分布,并可靠地捕捉了潜在的学习行为。Kullback-Leibler(KL)发散评估证实了最小的发散性,显示插补数据有效地保留了关键的学习特征。这些发现强调了 GAIN 在 ITSs 中作为稳健的插补工具的能力,减轻了数据稀疏性并支持适应性和个性化教学,最终导致更精准和响应性的 learners 评估,并提高教育成果。