10.3778/j.issn.1002-8331.1303-0086
基于位置的文本分类样本剪裁及加权方法
k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。
样本剪裁、样本加权、文本聚类、k近邻、文本分类
TP391(计算技术、计算机技术)
国家自然科学基金No.71071161;江苏省自然科学基金No.BK2012511。
2015-01-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
131-135