10.3969/j.issn.1671-1815.2021.34.052
基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约.为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets,CGAN)的航班延误预测模型.首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析.经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F1-score值分别提升了0.16、0.29、0.24个百分点.实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据.
航班延误;非平衡数据集;合成少数类过采样技术(SMOTE)算法;条件生成对抗网络;XGBoost模型;分类问题
21
V355.1(航空港(站)、机场及其技术管理)
国家重点研发计划;中央高校基本科研业务费中国民航大学专项
2022-01-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
14843-14852