10.3969/j.issn.1001-7119.2013.08.028
基于K均值随机森林快速算法及入侵检测中的应用
随机森林是一种优秀的集成学习算法,能很好地避免过拟合现象的发生。然而随机森林算法的时间复杂度通常较高,影响了该算法的广泛应用。针对这种不足,本文提出了一种基于K均值算法的随机森林快速学习算法,该算法首先利用经典的K均值算法对每一类原始样本进行聚类,然后对每一簇求样本中心,用样本中心作为新的样本点替换该类别的原始样本。然后利用随机森林对新构造的数据集合进行学习。在网络入侵检测数据集上的实验充分验证了本文算法较传统的随机森林算法具有更快的分类速度。
随机森林、K均值、聚类、样本中心
TP301.6(计算技术、计算机技术)
国家高技术发展计划“863”计划项目2007AA09Z323-2;山东省自然科学基金项目ZR2010DM016。
2013-09-11(万方平台首次上网日期,不代表论文的发表时间)
共3页
76-78