10.3969/j.issn.1001-5477.2017.05.016
基于Hadoop的Web应用日志挖掘
互联网上的大型站点每天都会产生大量的Web应用日志,这些日志中通常蕴藏着丰富且宝贵的信息,单节点的数据挖掘系统已无法满足挖掘海量Web日志的要求.针对该问题,研究利用云计算技术在存储和分析数据的优势,采用分布式数据挖掘方法,验证了以分布式模式挖掘日志较单机的集中模式的效率优势,提高了海量日志挖掘过程中存在的时空效率.
分布式计算、Hadoop、Yarn、日志挖掘
29
TP311(计算技术、计算机技术)
2018-01-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
94-99,111