10.3969/j.issn.1002-137X.2008.02.041
一种基于隐含子类信息的粗糙集中文文本分类方法
中文文本分类是中文信息检索和Web挖掘等领域的研究热点.现有的一些分类方法在特征选择阶段存在不足,忽略了隐含的子类信息.本文提出了一种提升隐含子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器.实验结果表明这种方法在不增加待约简词汇数量的情况下有效地提高了文本分类的查全率.
中文信息处理、粗糙集、文本分类、向量空间模型
35
TP3(计算技术、计算机技术)
高等学校博士学科点专项科研项目20060247039;国家自然科学基金60475019
2008-05-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
147-149