摘要
arXiv:2504.09063v1 安全事件类型:
摘要:本文描述了一种实用的方法,使用监督机器学习(ML)模型来协助安全调查人员将航空事件分类为事故或严重事故类别。我们目前部署为ML网络应用的实现是基于从公开可用的航空调查报告中获取的标记数据集进行训练。我们评估了五种监督学习模型(支持向量机、逻辑回归、随机森林分类器、XGBoost和K-最近邻)的选择。本文显示,随机森林分类器在准确性为0.77、F1分数为0.78和MCC为0.51(100次样本运行的平均值)时表现出最佳性能。该研究还探索了在不平衡数据集上应用合成 minority 过采样技术(SMOTE)的效果,总体观察结果显示,在某些模型上,SMOTE调整后性能显著下降,而在另一些模型上则未表现出显著影响。