10.11896/j.issn.1002-137X.2017.04.051
基于自然邻居和最小生成树的原型选择算法
K最近邻居是最流行的有监督分类算法之一.然而,传统的K最近邻居有两个主要的问题:参数K的选择以及在大规模数据集下过高的时间和空间复杂度需求.为了解决这些问题,提出了一种新的原型选择算法,它保留了一些对分类贡献很大的关键原型点,同时移除噪声点和大多数对分类贡献较小的点.不同于其他原型选择算法,该算法使用了自然邻居这个新的邻居概念来做数据顸处理,然后基于设定的终止条件构建若干个最小生成树.基于最小生成树,保留边界原型,同时生成一些具有代表性的内部原型.基于UCI基准数据集进行实验,结果表明提出的算法有效地约简了原型的数量,同时保持了与传统KNN相同水平的分类准确率;而且,该算法在分类准确率和原型保留率上优于其他原型选择算法.
K最近邻居、原型选择、自然邻居、最小生成树、分类
44
TP391(计算技术、计算机技术)
国家自然科学基金61272194
2017-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
241-245,268