基于Hive数据仓库的在线阅读用户建模与聚类方法
移动互联网的高速发展为在线阅读系统带来了海量的用户行为日志.针对日益巨大的TB甚至PB级用户行为日志数据,该文设计一种基于Hive数据仓库的用户模型及用户聚类方案.该方法能够准确的基于用户的阅读行为刻画用户的多维度、多尺度偏好特征,构建动态用户需求模型,并基于用户特征进行聚类,划分用户集,为个性化推荐、搜索或者广告投放等Web个性化应用提供服务.实验结果表明,该方法可以发挥集群存储和运算的优势,具有良好的性能和执行速度.
Hive、数据仓库、在线阅读、用户模型、用户聚类
11
TP311(计算技术、计算机技术)
科技部科技支撑项目2012BAH95F03
2016-03-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
45-48