基于项目概率分布的协同过滤推荐算法
[目的]解决传统项目相似性度量方法必须依赖于共同评分项,及传统方法在稀疏数据集中预测准确性不高的问题.[方法]将信号处理领域的KL散度引入项目相似性的计算中,利用评分值的概率密度分布计算项目相似性,可更有效地发现目标项目的相似邻居项目.[结果]在MovieLens数据集上的实验结果表明,该算法的推荐综合值F1超过0.65,在预测有效性、预测误差和推荐准确性等方面的评测结果均明显优于当前常用的项目相似性方法.[局限]只考虑了项目评分值的比率,未充分利用项目的绝对评分值.[结论]算法有效地利用了数据集内的评分信息,较好地克服了数据的稀疏性问题,具有很好的应用价值.
项目相似性、协同过滤、KL散度、推荐算法
TP391;G350(计算技术、计算机技术)
本文系国家自然科学基金项目“结合知识图谱的概率话题模型研究”项目编号:61502066和重庆市基础与前沿项目“面向产品评论的细粒度观点挖掘方法研究”项目编号:cstc2015jcyjA40025的研究成果之一.
2016-08-10(万方平台首次上网日期,不代表论文的发表时间)
73-79