10.3969/j.issn.1673-808X.2013.02.013
基于Hadoop的Nutch网页排序算法研究与实现
为了满足搜索引擎系统日益增长的高质量检索需求,针对Nutch搜索引擎框架没有实现Google的PageRank网页排序算法,分析了PageRank算法,并通过实验验证了PageRank算法的有效性,成功搭建Hadoop分布式集群,在Nutch框架中基于MapReduce分布式编程模式编码实现PageRank算法.实验结果表明,在Nutch搜索引擎系统中实现了PageRank算法后,系统的检索具有更高的准确率,能够更好地为用户提供检索服务.
Hadoop集群、MapReduce、Nutch、网页排序算法、PageRank
33
TP391(计算技术、计算机技术)
国家自然科学基金61163057;广西自然科学基金2012GXNSFAA053228
2013-08-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
139-143