10.3969/j.issn.1007-2683.2014.01.011
基于朴素贝叶斯模型的邮件过滤技术
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
邮件过滤、朴素贝叶斯、机器学习
19
TM391.1(电机)
黑龙江省普通高等学校新世纪优秀人才培养计划1155-ncet-008;教育部人文社科项目11YJC740048;黑龙江省教育科学规划课题GBC1211062:黑龙江省高等教育教学改革项目2011-NP33
2014-04-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
49-53