10.3969/j.issn.1002-137X.2013.08.038
NLOF:一种新的基于密度的局部离群点检测算法
基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测.通过对LOF算法的分析,提出了一种新的局部离群点检测算法NLOF,该算法的主要思想如下:在数据对象邻域查询过程中,尽可能地利用已知信息优化邻近对象的邻域查询操作,有关邻域的计算查找都采用这种思想.首先通过聚类算法DBSCAN对数据集进行预处理,得到初步的异常数据集.然后利用LOF算法中计算局部异常因子的方法计算初步异常数据集中对象的局部异常程度.在计算数据对象的局部异常因子的过程中,引入去一划分信息熵增量,用去一划分信息熵差确定属性的权重,对属性的权值做具体的量化,在计算各对象之间的距离时采用加权距离.在真实数据集上对NLOF算法进行了充分的验证.结果显示,该算法能够提高离群点检测的精度,降低时间复杂度,实现有效的局部离群点的检测.
数据挖掘、离群点检测、信息熵、聚类
40
TP311.13(计算技术、计算机技术)
国家自然科学基金项目61170017
2013-10-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
181-185