10.3969/j.issn.1008-0821.2014.10.033
Hadoop平台在图书推荐应用中的性能分析
构建基于分布式平台及大量借阅数据的图书推荐算法,是实现图书馆个性化信息推送服务的关键环节.本文从搭建Hadoop分布式平台和运用Mahout的MapReduce实现算法入手,针对读者借阅记录的分类号进行频数统计和借阅时间统计,依据借阅次数和借阅时间获得偏好值.并使用Mahout基于图书的推荐器,测试伪分布式单节点模式和完全分布式MapReduce计算框架下的推荐效果.测试表明:在MapReduce运算中增加DataNode的数量同时优化BlockSize参数能显著缩短运算时间,是实现个性化荐书服务自动推送的可行方法.
Hadoop、MapReduce、Mahout、个性化图书推荐、信息推送
34
G250.76(图书馆学、图书馆事业)
2014-12-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
157-161