10.3969/j.issn.1671-1815.2023.03.028
面向网络安全不平衡数据的特征学习和分类研究应用
网络数据的正确分类对于网络环境的监控和维护具有重要作用.在数据不平衡状态下解决数据分类和处理复杂的特征关系尤为重要,为此提出一种改进SMOTE(synthetic minority over-sampling technique)+GA-XGBoost(genetic algorithm-ex-treme gradient boosting)的机器学习分类方法.将局部离群因子引入SMOTE插值过程,对少数类样本过采样,并对多数类样本随机欠采样,从而实现样本再平衡;同时,在模型训练过程中为增加模型拟合度,将具有进化迭代优势的遗传算法与XGBoost相结合,解决XGBoost参数众多、特征学习收敛较慢等问题.实验采用UNSW_NB15数据集,选择多层感知机、K近邻、决策树等机器学习算法及SMOTE+XGBoost等不平衡数据训练方法进行试验对比,结果表明该方法具有较好的分类预测准确率(97.40%)及较高的平均召回率(70.2%)和平均F1-score(68.8%).并在本实验室工业信息安全平台采集的数据进行实验研究,分类准确率为99%,进一步验证了该方法的有效性和可行性.
网络安全、机器学习、改进SMOTE、遗传算法、XGBoost
23
TP309(计算技术、计算机技术)
辽宁省兴辽英才计划项目XLYC2002085
2023-03-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
1130-1137