10.3778/j.issn.1002-8331.2010.03.034
基于属性值信息熵的KNN改进算法
为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN.首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度,其次算法Entropy-KNN根据上述定义的距离选取与待测试样本距离最小的K个近邻,最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别.在蘑菇数据集上的实验表明,Entropy-KNN算法的分类准确率高于传统KNN算法和距离加权KNN算法.
分类、KNN算法、属性值、信息熵
46
TP391(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 10971186
2010-03-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
115-117