10.3969/j.issn.1006-2475.2016.09.022
基于文本过滤的贝叶斯分类算法的改进
针对传统贝叶斯分类算法无法满足复杂网络文本过滤需求,提出一种多词-贝叶斯分类算法(Multi Word-Bayes,MWB).该算法一方面引入了特征权重(Term Frequency-Inverse Document Frequency,TF-IDF)的计算思想,优化了传统贝叶斯分类算法只考虑词频不考虑文本间关系的问题;另一方面将词与词间的关系作为文本分类的重要参考项,克服了传统贝叶斯分类算法在分类器训练上对语义分析的忽视.实验结果表明,MWB在垃圾文本过滤上具有更好的分类性能.
贝叶斯分类算法、TF-IDF、语义分析、文本过滤
TP311(计算技术、计算机技术)
2016-11-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
100-103,108