期刊专题

10.11925/infotech.2096-3467.2017.1188

基于主成分分析和随机森林的恶意网站评估与识别

引用
[目的]充分利用网站多源评测指标,研究恶意网站的评估和识别问题.[方法]在广泛收集网站多源评测指标的基础上,采用主成分分析法对恶意网站进行多维度评估,并在此基础上利用随机森林分类算法构建恶意网站识别模型.[结果]所构建方法可以有效提取权威、引用、访问量、排名、链接5个评估维度;同时,基于主成分分析法和随机森林的恶意网站识别模型具有较高的准确率和识别效率.[局限]受数据获取的限制,本研究样本大多属于国外网站,所提取的维度可能与国内恶意网站有一定差异;同时没有考虑恶意网站与正常网站的数量存在不均衡问题.[结论]所构建的基于主成分分析和随机森林的模型既可以提取具有较好解释性的网站评价维度,又具有较高的识别准确率和效率,对后续恶意网站的评估与识别研究具有借鉴意义.

恶意网站、评估与识别、主成分分析、随机森林

2

G353(情报学、情报工作)

国家自然科学基金面上项目“创新2.0超网络中知识流动和群集交互的协同研究”71373194;国家自然科学基金青年基金项目“基于集成学习的区间型电力负荷预测技术研究”项目71601147的研究成果之一

2018-08-16(万方平台首次上网日期,不代表论文的发表时间)

共10页

71-80

相关文献
评论
暂无封面信息
查看本期封面目录

数据分析与知识发现

1003-3513

11-2856/G2

2

2018,2(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn