融合多源网络评估数据及URL特征的钓鱼网站识别技术研究
[目的]充分利用多源网络评估数据和URL异常特征数据,研究提高钓鱼网站识别准确性的可行性方案.[方法]采用8种机器学习技术,对比研究网络评估数据与传统的URL异常特征数据在钓鱼网站识别中的性能,并融合两类数据研究进一步提高钓鱼网站识别准确性的可行性方案.[结果]在钓鱼网站识别中,相比于传统的URL异常特征,利用网络评估数据可以取得更好的识别效果.融合两类数据对于提高识别准确性有一定帮助.[局限]未考虑钓鱼网站与正常网站的数量存在严重的不均衡问题.[结论]充分利用多源网络评估数据和URL异常特征数据识别钓鱼网站的方法是比较合理和有效的,对后续相关研究具有一定的借鉴意义.
数据挖掘、钓鱼网站识别、机器学习
G353(情报学、情报工作)
国家自然科学基金面上项目“创新2.0超网络中知识流动和群集交互的协同研究”71373194;国家自然科学基金青年基金项目“基于集成学习的区间型电力负荷预测技术研究”项目71601147的研究成果之一
2017-10-20(万方平台首次上网日期,不代表论文的发表时间)
共9页
47-55