期刊专题

10.16652/j.issn.1004-373x.2017.09.031

基于Hadoop的网络日志挖掘方案的设计

引用
提出一种挖掘指数级别网络日志数据的解决思路,设计了一个高可靠的网络日志数据挖掘方案.针对现有的公开网络日志数据集,在数据预处理阶段实现了基于MapReduce的过滤算法,并且挖掘出支持企业决策的服务信息.对该方案搭建的平台进行优化操作,性能提升了3.26%,最后对方案的高可靠性、日志文件个数对平台I/O速度的影响、平台和单机在查询性能上的对比等方面做了实验.结果表明:该设计方案不仅可靠,而且随着日志文件个数的翻倍增加,读操作耗时平均增加52.58%,写操作耗时平均增加79.69%.随着日志量的增加,单机的查询耗时急剧增长,而平台的查询耗时趋于稳定.随着机器节点的增加,运算耗时以平均8.87%的速度减少.

网络日志、数据挖掘、数据清洗、Hadoop、MySQL

40

TN711-34;TP391.9(基本电子电路)

国家自然科学基金项目NSF61370161;贵州省科学技术基金项目黔科合J字[2010]2100;贵州大学博士基金项目贵大人基合字2009029

2017-05-24(万方平台首次上网日期,不代表论文的发表时间)

共6页

115-120

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

40

2017,40(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn