摘要
在处理右删失数据(由于观察期有限而导致某些结果缺失)时,生存分析(也称为事件时间分析)侧重于预测直至感兴趣事件发生的时间。多类别结果导致了一种分类变体:预测最可能的事件,这是一个鲜为人知的领域,称为竞争风险。经典的竞争风险模型将架构和损失函数耦合在一起,限制了可扩展性。为了解决这些问题,我们设计了一个严格正确的删失调整可分离评分规则,允许在数据子集上进行优化,因为每个观察值都是独立评估的。该损失函数估计结果概率,并支持竞争风险的随机优化,我们将其用于高效的梯度提升树。SurvivalBoost 不仅在 4 个真实数据集上的多个指标上都优于 12 个最先进的模型(在竞争风险和生存环境中),而且还具有良好的校准性、能够预测任何时间范围以及比现有方法更快的计算速度。