DOI：10.3778/j.issn.1002-8331.2012.22.020

基于MapReduce的Web日志挖掘

引用

摘要：

针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法.为进一步验证该算法的高效性,通过搭建Hadoop平台,利用该算法挖掘Web日志中用户的偏爱访问路径.实验结果表明,充分利用了集群系统的分布式计算能力处理大量的Web日志文件,可以大大地提高Web数据挖掘的效率.

关键词：云计算、Map/Reduce、Hadoop平台、Web日志挖掘、蚁群算法

所属期刊栏目：48

分类号：TP311(计算技术、计算机技术)

在线出版日期：2012-12-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：95-98

英文信息展示

期刊专题