10.3969/j.issn.1002-137X.2012.07.057
一种基于权重的文本特征选择方法
在分析比较几种常用的特征选择方法的基础上,提出了一种引入文本类区分加权频率的特征选择方法TFIDF_Ci.它将具体类的文档出现频率引入TFIDF函数,提高了特征项所在文档所属类区分其他类的能力.实验中采用KNN分类算法对该方法和其他特征选择方法进行了比较测试.结果表明,TFIDF Ci方法较其他方法在不同的训练集规模情况下具有更高的分类精度和稳定性.
特征选择、TFIDF、KNN分类算法
39
TP391(计算技术、计算机技术)
湖南省教育厅基金项目09C890
2012-12-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
250-252,275