10.3969/j.issn.1008-0821.2009.02.053
基于词频的中文文本分类研究
本文对中文文本分类系统的设计和实现进行了阐述,对分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细的介绍.将基于词频统计的方法应用于文本分类.并提出了一种基于汉语中羊字词及二字词统计特性的中文文本分类方法,在无词表的情况下,通过统计构造单字和二字词表,对文本进行分类,并取得不错的效果.
词频统计、特征选取、中文文本分类
29
TP393(计算技术、计算机技术)
2009-04-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
179-181