10.3778/j.issn.1002-8331.1502-0078
基于聚类的两段式孤立点检测算法
现有的大多数孤立点检测算法都需要预先设定孤立点个数,并且还缺乏对不均匀数据集的检测能力。针对以上问题,提出了基于聚类的两段式孤立点检测算法,该算法首先用DBSCAN聚类算法产生可疑孤立点集合,然后利用剪枝策略对数据集进行剪枝,并用基于改进距离的孤立点检测算法产生最可能孤立点排序集合,最终由两个集合的交集确定孤立点集合。该算法不必预先设定孤立点个数,具有较高的准确率与检测效率,并且对数据集的分布状况不敏感。数据集上的实验结果表明,该算法能够高效、准确地识别孤立点。
孤立点检测、距离、DBSCAN算法、剪枝
52
TP311(计算技术、计算机技术)
国家青年科学基金项目No.61003162;辽宁省教育厅项目No.L2013131。
2016-10-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
98-102,176