10.3969/j.issn.1009-3044.2010.25.011
基于TF*IDF垃圾邮件过滤改进算法的研究
传统TF*IDF算法是计算忽视了在一类文档中反复出现的单词,反复出现的单词往往最具有代表该类文档的特征,权重应该是比较高的.但这种情况,传统TF*IDF算法计算出结果恰恰相反,权重偏低,达不到设计者的要求.故通过改进了传统TF*IDF算法计算公式,来增加这些单词的权重.实验证明改进算法优于传统算法.
TF*IDF、权重、分类、垃圾邮件
6
TP301.6(计算技术、计算机技术)
2010-12-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
6928-6930