基于网格和密度的海量数据增量式离群点挖掘算法
处理海量和高维数据已经成为设计离群点算法面临的重要任务和挑战,针对海量数据的特点提出一种基于网格和密度的增量式离群点挖掘算法IGDLOF,算法的基本思想为:采用网格的七元组信息减少数据维数和数量,利用增量更新减少内存需求.通过代表点过滤相应的主体数据,先判断再进行近似密度计算的方法减少计算量,降低算法的复杂度.通过在真实和仿真数据集的测试表明,IGDLOF增量算法可与LOF算法保持相同的精确度,而执行效率得到显著的提高.
海量数据、网格、密度、离群点挖掘、增量、LOF算法
48
TP311(计算技术、计算机技术)
国家自然科学基金项目40871176,60873176
2011-09-09(万方平台首次上网日期,不代表论文的发表时间)
共8页
823-830