10.3778/j.issn.1002-8331.2009.14.041
改进的X2统计文本特征选择方法
特征选择是当今研究领域的一个热点,尤其是文本分类领域中的热点.针对X2统计方法的两个缺陷:降低了低频词的权重和提高了很少在指定类中出现但普遍存在于其他类的特征在该类中的权重,对X<;2>统计方法进行改进,并通过做模拟和对比实验,对比改进前后的方法对文本分类的影响.在模拟和对比实验中,改进后方法的分类效果要好于传统的方法.
文本分类、特征选择、X2统计
45
TF39(冶金机械、冶金生产自动化)
2009-06-12(万方平台首次上网日期,不代表论文的发表时间)
共3页
136-137,140