10.3969/j.issn.1671-1815.2014.36.017
基于投影寻踪的kNN文本分类算法的加速策略
传统的后近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法.针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略.基本思想是:通过投影的方法缩减训练集的规模,同时在寻找七近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销.实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度.
kNN、文本分类、投影寻踪、降维、训练集缩减
14
TP391.3(计算技术、计算机技术)
2015-02-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
92-96,102