10.3969/j.issn.1002-137X.2012.02.044
一种基于信息熵的多维流数据噪声检测算法
流数据噪声检测是一个比较困难的领域.由于流数据的一些特殊性,使得以前的一些处理静态数据的算法对于流数据的处理而言都不理想.在局部离群点(LOF)思想的基础上,引入信息熵来计算数据各维属性的信息增益,并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF.实验结果表明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力.
噪声检测、流数据、数据挖掘、信息熵
39
TP311(计算技术、计算机技术)
国家自然科学基金60973040;国家自然科学青年基金60903098;吉林省科技发展计划项目20070533;教育部高等学校博士学科点专项科研基金200801830021;吉林大学基本科研业务费交叉学科与创新项目200810025
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
191-194