10.3772/j.issn.1002-0470.2015.10-11.007
基于网页结构的网站检测研究
为了准确检测出仿冒网站,提出了一种基于网页结构的页面相似度计算方法.该方法首先将网页分块并进行合理的筛选,其次通过初步比对确定相似节点群,最后将网页数据量化并计算出网页是否相似.试验表明,该方法可以有效地检测出网页相似情况,对于仿冒网站的镜像尤其明显,误报率及漏报率均不超过10%.
网页结构、节点筛选、网页比对
25
TP3;TP2
国家自然科学基金61170262,61371177
2016-03-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
912-918