10.3778/j.issn.1002-8331.2009.22.018
新型快速中文文本分类器的设计与实现
为了提高中文文本分类的效率与精度,设计了一种新型的分类器.该分类器采用基于词频、互信息和类别信息的综合评估函数进行选择特征;在特征权重计算上,由于传统TF-IDF方法没有考虑特征类间和类内分布,提出了一种将词频和综合评估函数值相结合的权重计算方法;最后设计了一种基于贝叶斯原理的快速分类器.实验证明该分类器简单有效.
中文文本分类、特征选择、特征权重、分类算法
45
TP18(自动化基础理论)
2009-09-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
53-55