10.3778/j.issn.1002-8331.1911-0132
网页内容链接层次语义树的恶意网页检测方法
针对攻击者利用URL缩短服务导致仅依赖于URL特征的恶意网页检测失效的问题,及恶意网页检测中恶意与良性网页高度不均衡的问题,提出一种融合网页内容层次语义树特征的成本敏感学习的恶意网页检测方法.该方法通过构建网页内容链接层次语义树,提取基于语义树的特征,解决了URL缩短服务导致特征失效的问题;并通过构建成本敏感学习的检测模型,解决了数据类别不均衡的问题.实验结果表明,与现有的方法相比,提出的方法不仅能应对缩短服务的问题,还能在类别不均衡的恶意网页检测任务中表现出较低的漏报率2.1%和误报率3.3%.此外,在25万条无标签数据集上,该方法比反病毒工具VirusTotal的查全率提升了38.2%.
恶意网页检测、缩短服务、链接层次语义树、成本敏感
56
TP309(计算技术、计算机技术)
国家自然科学基金;中北大学第十四届研究生科技立项
2020-06-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
90-97