10.3969/j.issn.1673-808X.2016.02.008
基于多层MapReduce的混合网络流量分类特征选择方法
针对传统的特征选择方法只适用于小规模数据集、运行效率低的缺陷,结合 Filter方法和 Wrapper方法的特点,提出一种基于多层MapReduce的混合网络流量分类特征选择方法。该方法通过Fisher score对数据进行预处理,剔除部分无关特征,实现高维数据的降维。采用序列前向搜索的搜索策略,通过多层 MapReduce 实现不断选取分类能力最好的特征。实验结果表明,该方法既保持较高的分类精度,又减少特征选择时间,实现较好的加速比,提高了网络流量分类的执行效率。
特征选择、Fisher score、SFS、MapReduce
36
TP301.1(计算技术、计算机技术)
国家自然科学基金61163058,61363006;广西可信软件重点实验室开放基金KX201306
2016-06-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
123-128