垃圾邮件过滤中信息增益的改进研究
针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法.首先利用特征词的先验概率定义增益比,然后利用增益比对特征词为整个分类所提供的信息量进行放大或弱化,从而对特征词的类别条件熵计算作了改进,采用极大后验假设朴素贝叶斯决策方法在英文语料库上进行实验,通过召回率、正确率、精确率和错误率对算法进行评价分析.实验结果表明,改进后的算法提高了过滤器的分类精度,降低了过滤器对合法邮件的误判给用户带来的损失.
信息增益、特征选择、垃圾邮件、朴素贝叶斯
41
TP391(计算技术、计算机技术)
国家自然科学基金61104106
2014-07-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
214-216,224