基于非平衡数据处理方法的网络在线广告中点击欺诈检测的研究
网络在线广告中以套取广告费为目的的点击欺诈检测是机器学习应用的重要内容之一.支持向量机(Sup-port Vector Machine,SVM)是一种优秀的解决二分类和回归问题的机器学习算法,但应用于网络在线广告中的欺诈点击检测时,由于数据集的极端非平衡性,算法性能受到极大的限制.从 FDMA20 1 2 竞赛欺诈发布商检测的真实数据集出发,在详细研究与对比了 3 种非平衡数据处理方法后,选取最佳的混合采样方法对原始数据进行处理,再将其应用于 SVM分类器.实验结果表明,所提方法能够有效识别实施欺诈点击行为的非法发布商,准确度达到 9 5%左右,满足了网络在线广告中点击欺诈检测的要求.
点击欺诈、支持向量机、非平衡、混合采样
45
TP393(计算技术、计算机技术)
国家自然科学基金资助项目61672279;江苏省重点研发计划项目BE2015697
2018-08-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
371-374