10.19772/j.cnki.2096-4455.2021.11.066
基于IMI-WNB算法的垃圾邮件过滤技术研究
工业互联网中日益发展完善的电子邮件为工作带来了极大便利,但同时也遭受着垃圾邮件的侵害,然而传统垃圾邮件过滤算法不适应工业互联网环境.针对传统垃圾邮件过滤算法对工业互联网环境的准确率和召回率较低,本文提出一种结合改进的互信息特征以及带权重的朴素贝叶斯分类的算法,完成对工业互联网垃圾邮件的过滤.该算法通过引入词频率因子和类别间差异因子来改进互信息计算,并将计算结果作为朴素贝叶斯分类的属性权重,完成对垃圾邮件的过滤.在trec06c开源数据集上进行了对比实验,实验结果表明本文提出算法比传统朴素贝叶斯分类具有更好的鲁棒性,且在垃圾邮件过滤的准确率和召回率上都显著优于传统算法,实际应用时具有更好的可行性与有效性.
互信息特征、词频率因子、类别间差异因子、加权朴素贝叶斯、垃圾邮件过滤
5
TP3(计算技术、计算机技术)
工业和信息化部工业互联网创新发展工程项目
2022-05-09(万方平台首次上网日期,不代表论文的发表时间)
共3页
165-167