摘要
arXiv:2502.01634v1 类型: cross
摘要: 梯度提升决策树(GBDT)是各种应用中最流行的机器学习模型之一。然而,在传统的设置中,所有数据都应该在训练过程中同时访问:它不允许在训练后添加或删除任何数据实例。在本文中,我们提出了一种适用于GBDT的高效在线学习框架,支持增量学习和减少学习。据我们所知,这是第一个考虑在GBDT上就地统一进行增量和减少学习的研究工作。为了降低学习成本,我们为该框架呈现了一系列优化措施,使其能够在不中断处理的情况下添加或删除少量数据。我们从理论上展示了所提出的优化参数之间的关系,这使得在增量和减少学习之间可以权衡准确性和成本。后门攻击的结果显示,我们的框架可以使用增量和减少学习成功地向训练好的模型注入和移除后门,并且在公开数据集上的实验证明了我们所提出在线学习框架及其优化措施的有效性和效率。