10.3969/j.issn.1006-2475.2010.04.010
文本分类中特征选择方法的分析和改进
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.基于向量空间的文本分类方法中,信息增益是一种有效的特征选择方法.本文改进信息增益的特征选择方法:降低负类对分类的贡献;改进特征项在类中的均匀程度对分类的贡献.实验结果表明,经过改进的信息增益的特征选择方法在分类效果上有显著的提高.
文本分类、信息增益、特征选择、熵
TP311(计算技术、计算机技术)
2010-05-31(万方平台首次上网日期,不代表论文的发表时间)
共3页
37-39