10.3321/j.issn:1002-8331.2007.25.039
简体中文垃圾邮件分类的实验设计及对比研究
综合分析了垃圾邮件过滤的技术路线与方法,并在分析基于关键字的方法和统计学的方法的基础上,提出了将两者相结合,运用模式识别中的贝叶斯、最近邻和感知机等分类方法,实现对垃圾邮件的过滤的技术路线.以互信息最大化准则筛选出的特征集为基础,对不同分类技术的对比分析揭示了贝叶斯、最近邻和感知机在垃圾邮件过滤应用上的优劣.同时,文中对基于互信息最大化准则的垃圾邮件过滤应用提出了有益的思路.
垃圾邮件、分类器、贝叶斯、最近邻、感知机
43
TP319.4(计算技术、计算机技术)
国家自然科学基金60602038;广东省自然科学基金06300862
2007-10-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
128-132