10.3969/j.issn.1671-1815.2021.07.029
基于权重搜索树改进K近邻的高维分类算法
信息采集技术日益发展导致的高维、大规模数据,给数据挖掘带来了巨大挑战,针对K近邻分类算法在高维数据分类中存在效率低、时间成本高的问题,提出基于权重搜索树改进K近邻(K-nearest neighbor algorithm based on weight search tree,KNN-WST)的高维分类算法,该算法根据特征属性权重的大小,选取部分属性作为结点构建搜索树,通过搜索树将数据集划分为不同的矩阵区域,未知样本需查找搜索树获得最"相似"矩阵区域,仅与矩阵区域中的数据距离度量,从而降低数据规模,以减少时间复杂度.并研究和讨论最适合高维数据距离度量的闵式距离.6个标准高维数据仿真实验表明,KNN-WST算法对比K近邻分类算法、决策树和支持向量机(support vector machine,SVM)算法,分类时间显著减少,同时分类准确率也优于其他算法,具有更好的性能,有望为解决高维数据相关问题提供一定参考.
高维数据、K近邻分类算法、特征属性、搜索树、闵氏距离
21
TP301.6(计算技术、计算机技术)
国家自然科学基金;广西科技重大专项;广西重点研发项目
2021-05-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
2760-2766