10.7544/issn1000-1239.2019.20180793
基于相似度量的自适应三支垃圾邮件过滤器
垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题然而,较之于三支决策模型,二分类模型会产生较大的错分代价作为三支决策的一个重要分支,基于决策理论粗糙集的三支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响因此,在基于决策理论粗糙集的三支决策模型的基础上,提出了一种基于相似度量的自适应三支垃圾邮件分类模型该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法实验结果表明所提模型在垃圾邮件过滤领域表现优异.
垃圾邮件过滤、决策理论粗糙集、三支决策、相似度量、阈值
56
TP301.6(计算技术、计算机技术)
国家自然科学基金项目61876201,61772096;重庆市研究生科研创新项目CYS18244
2019-12-05(万方平台首次上网日期,不代表论文的发表时间)
共14页
2410-2423