期刊专题

10.11896/j.issn.1002-137X.2018.01.008

基于Nystr(o)m采样和凸NMF的偏好聚类

引用
大规模的稀疏图数据在现实中大量出现,例如协同图、拉普拉斯矩阵等.非负矩阵分解(NMF)已经成为数据挖掘、信息检索和信号处理的一个非常重要的工具.随着数据量的不断增大,如何实现大规模数据的偏好聚类是一个重要的问题.采用两阶段的方法来实现大规模的偏好聚类,即首先利用Nystr(o)m的近似采样方法,从大数据上获得数据的初始轮廓,获得部分用户-用户相似矩阵或电影-电影相似矩阵,从而可以将原始的高维空间降低到一个低维子空间;然后通过对低维相似矩阵进行凸的非负矩阵分解,从而得到聚类的中心和指示器,聚类的中心表示电影或用户的特征,指示器表示用户或电影特征的权重.该两阶段偏好聚类方法的优点是,初始数据轮廓的近似获取以及凸的非负矩阵分解,使得该方法具有较好的鲁棒性和抗噪性;另外,子空间的数据来源于真实的矩阵行列数据,使得偏好聚类结果具有良好的可解释性.采用Nystr(o)m方法解决了大规模的数据无法在内存中存储的问题,从而大大节省了内存,提高了运行效率.最后在合有100000条电影的数据集上进行偏好聚类,结果表明了该聚类算法的有效性.

Nystr(o)m方法、凸的非负矩阵分解、偏好聚类、聚类中心、聚类指示器

45

TP181(自动化基础理论)

国家自然科学基金61572419,61572418,61403328,61403329;山东省自然科学基金ZR2014FQ016,ZR2014FQ026,2015GSF115009,ZR2013FM011

2018-04-04(万方平台首次上网日期,不代表论文的发表时间)

共8页

55-61,78

暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

45

2018,45(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn