基于集成聚类的流量分类架构
流量分类是优化网络服务质量的基础与关键.机器学习算法利用数据流统计特征分类流量,对于识别加密私有协议流量具有重要意义.然而,特征偏置和类别不平衡是基于机器学习的流量分类研究所面临的两大挑战.特征偏置是指一些数据流统计特征在提高部分应用识别准确率的同时也降低了另外一部分应用识别的准确率.类别不平衡是指机器学习流量分类器对样本数较少的应用识别的准确率较低.为解决上述问题,提出了基于集成聚类的流量分类架构(traffic classification framework based on ensemble clustering,简称TCFEC).TCFEC由多个基于不同特征子空间聚类的基分类器和一个最优决策部件构成,能够提高流量分类的准确率.具体而言,与传统的机器学习流量分类器相比,TCFEC的平均流准确率最高提升5%,字节准确率最高提升6%.
基于集成聚类的流量分类架构、集成聚类、流量分类、数据流特征、机器学习
27
TP393(计算技术、计算机技术)
国家自然科学基金61303061,61402485;高性能计算国家重点实验室开放课题201513-01National Natural Science Foundation of China61303061,61402485;Open Fund from HPCL201513-01
2016-12-13(万方平台首次上网日期,不代表论文的发表时间)
共14页
2870-2883