10.3772/j.issn.1000-0135.2012.09.012
基于改进近邻传播算法的Web用户聚类
随着Internet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显.Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的.对于处理大规模的数据集,近邻传播算法是一种快速、有效的聚类方法.但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类.本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类.根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类.实验结果表明新算法是有效的,与原始近邻传播算法相比,新算法在个性化推荐的应用中具有更好的性能.
Web用户聚类、稀疏性、近邻传播算法、相似度矩阵
31
TP3;P49
国家自然科学基金重点项目70631003
2012-10-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
993-997