10.3321/j.issn:1002-8331.2007.13.048
用于文本分类的改进KNN算法
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则.
文本分类、KNN算法、灵敏度法、CURE聚类算法、Tabu算法
43
TP311(计算技术、计算机技术)
国家自然科学基金60275020
2007-10-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
159-162,166