10.3969/j.issn.1002-137X.2008.12.051
屏蔽输入参数敏感的异常点检测新方法
大多数基于密度的异常点检测算法需要设置两个输入参数,并对输入参数很敏感,用户设置不正确会导致算法不能发现所有有意义的异常点,甚至是发现错误的异常点,这使得评价一个数据挖掘算法的"3-E"标准中"易于使用"这一点不能得到满足.为此,首先根据对象的邻域、反邻域和局部密度构造基于邻域的局部密度因子NLDF,NLDF可指示异常点的异常程度,然后提出一种屏蔽输入参数敏感的异常点检测算法ODINP.ODINP的一个非常显著的优点就是只需要一个参数k并且对k不敏感.该算法在保持已有基于密度的异常点检测算法高效性的同时,具有很高的异常点检测精度.大规模、任意形状和高维数据集的测试结果表明该算法是有效的、可行的.
数据挖掘、异常点检测、参数、邻域、密度
35
TP3;TU3
国家高技术研究发展计划863计划项目 2007AA01Z404 资助
2009-02-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
192-195,206