DOI：10.3969/j.issn.1008-0821.2014.10.033

Hadoop平台在图书推荐应用中的性能分析

引用

摘要：

构建基于分布式平台及大量借阅数据的图书推荐算法,是实现图书馆个性化信息推送服务的关键环节.本文从搭建Hadoop分布式平台和运用Mahout的MapReduce实现算法入手,针对读者借阅记录的分类号进行频数统计和借阅时间统计,依据借阅次数和借阅时间获得偏好值.并使用Mahout基于图书的推荐器,测试伪分布式单节点模式和完全分布式MapReduce计算框架下的推荐效果.测试表明:在MapReduce运算中增加DataNode的数量同时优化BlockSize参数能显著缩短运算时间,是实现个性化荐书服务自动推送的可行方法.

关键词：Hadoop、MapReduce、Mahout、个性化图书推荐、信息推送

所属期刊栏目：34

分类号：G250.76(图书馆学、图书馆事业)

在线出版日期：2014-12-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：157-161

英文信息展示

期刊专题