DOI：10.3969/j.issn.1000-565X.2014.07.004

基于用户兴趣度的垃圾邮件在线识别新方法

引用

摘要：

多数在线垃圾邮件识别方法未有效区分用户针对不同邮件内容的感兴趣程度，导致垃圾邮件识别精度不高。文中提出了一种基于支持向量机的垃圾邮件在线识别新方法。即结合传统增量学习及主动学习理论，先通过随机选择代表样本寻找分类最不确定的样本进行人工标注；接着引入用户兴趣度的概念，提出了新的样本标注模型和算法性能评价标准；最后结合“轮盘赌”方法将标注后样本加入训练样本集。多种对比实验表明，文中方法针对垃圾邮件识别精度高，样本训练及待标注样本选择速度快，具有较高的在线应用价值。

关键词：垃圾邮件、支持向量机、增量学习、主动学习、用户兴趣

分类号：TP391(计算技术、计算机技术)

资助基金：国家科技成果转化项目财建[2011]329，财建[2012]258

在线出版日期：2014-11-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：21-27

英文信息展示

期刊专题