10.3778/j.issn.1002-8331.1107-0512
新的文本分类特征选择方法研究
特征降维是文本分类过程中的一个重要环节.在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法.实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果.
特征降维、文本分类、特征选择、综合比率、K-最近邻分类算法
49
TP391(计算技术、计算机技术)
重庆市科委自然科学基金计划资助项目2007BB2372;中央高校研究生创新基金CDJXS11180013
2013-07-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
132-135