10.3778/j.issn.1002-8331.1401-0216
基于粗约简和网格的离群点检测
为解决现有高维海量数据离群点挖掘在时间与空间效率上的不足,提出了一种基于粗约简和网格的离群点检测算法RRGOD。算法在基于密度的离群点检测算法LOF的基础上,结合粗糙集理论特点,引入属性权值概念,淘汰属性权值低于重要度阈值的属性降低维度,从而减少了进行聚类的计算量。在网格聚类阶段,对传统的网格划分方法进行改进,引入属性维半径向量概念,提出了一种可变网格划分方法,根据数据集特点自适应地划分网格空间。在真实数据集和仿真数据集上进行了实验。结果表明,该算法在进行离群点检测时能在保持足够精确度的同时,检测效率有显著的改善。
数据挖掘、离群点检测、粗糙集、网格、属性权值
TP311(计算技术、计算机技术)
国家自然科学基金No.61170017,No.61370108。
2015-02-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
133-137,180