10.3969/j.issn.1002-137X.2009.11.052
基于类别选择的改进KNN文本分类
特征高维性以及算法的泛化能力影响了KNN分类器的分类性能.提出了一种降维条件下基于类别的KNN改进模型,解决了k近邻选择时大类别、高密度样本占优问题.首先使用一种改进的优势率方法进行特征选择,随后使用类别向量对文本类别进行初步判定,最后在压缩后的样本集上使用KNN分类器进行分类.试验结果表明,提出的改进分类模型提高了分类效率.
k-最近邻、特征降维、特征选择、文本分类
36
TP391(计算技术、计算机技术)
国家自然科基金项目70571087
2010-01-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
213-216