10.3969/j.issn.1002-5057.2020.06.005
一种基于stacking集成学习的DGA域名检测方法
目前针对基于机器学习的DGA算法生成域名检测方法普遍存在的特征信息不全、检测精度不高等问题,提出了一种基于stacking集成学习的DGA域名检测方法.通过挖掘正常域名和DGA生成域名的字符特征、语言特征,并进一步提取出域名的衍生特征HMM系数共同作为域名特征,选择距离预测方法的KNN模型和基于超平面分类方法的SVM模型,并使用基于梯度提升迭代决策树方法的CatBoost模型共同作为基分类器,同时以SVM作为第二层元分类器进行回归,通过stacking集成学习方法对DGA域名进行检测.实验证明,该方法一定程度的提升了检测的精确度和召回率.
DGA、HMM、集成学习、Stacking
国家自然科学基金[U1736212,;四川省重点研发项目[2018GZ0183,;中国博士后科学基金[2019TQ0217;中央高校基本科研业务经费[YJ201933
2021-02-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
19-24