10.3969/j.issn.1006-2475.2021.07.019
基于概念漂移检测的网络数据流分类
互联网环境日新月异,使得网络数据流中存在概念漂移,对数据流的分类也由传统的静态分类变为动态分类,而如何对概念漂移进行检测是动态分类的关键.本文提出一种基于概念漂移检测的网络数据流自适应分类算法,通过比较滑动窗口中数据与历史数据的分布差异来检测概念漂移,然后将窗口中数据过采样来减少样本间的不均衡性,最后将处理后的数据集输入到OS-ELM分类器中进行在线学习,从而更新分类器使其应对数据流中的概念漂移.本文在MOA实验平台中使用合成数据集和真实数据集对提出的算法进行验证,结果表明,该算法较集成学习算法在分类准确率和稳定性上有一定的提升,并且随着数据流量的增加,时间性能上的优势开始体现,适合复杂多变的网络环境.
概念漂移;数据流分类;滑动窗口;OS-ELM;过采样
TP311(计算技术、计算机技术)
国家重点研发项目2016YFD0702001
2021-08-06(万方平台首次上网日期,不代表论文的发表时间)
共8页
107-114