10.7544/issn1000-1239.2016.20148284
基于非负矩阵分解的大规模异构数据联合聚类
异构信息网络中包含多类实体和关系.随着数据规模增大时,不同类实体规模增长不平衡,异构关系数据也变得异常稀疏,导致聚类算法的时间复杂度高、准确率低.针对上述问题,提出了一种基于关联矩阵分解的2阶段联合聚类算法FNMTF-CM.第1阶段,抽取规模较小的一类实体中的关联关系构建关联矩阵,通过对称非负矩阵分解得到划分指示矩阵.与原始关系矩阵相比,关联矩阵的稠密度更高,规模更小.第2阶段,将划分指示矩阵作为关系矩阵三分解的输入,进而快速求解另一类实体的划分指示矩阵.在标准测试数据集和异构关系数据集上的实验表明,算法准确率和性能整体优于传统的基于非负矩阵分解的联合聚类算法.
异构网络、联合聚类、非负矩阵分解、大规模数据、关联矩阵
53
TP391(计算技术、计算机技术)
国家“八六三”高技术研究发展计划基金项目2012AA012802;国家自然科学基金项目61170242 This work was supported by the National High Technology Research and Development Program of China 863 Program2012AA012802;the National Natural Science Foundation of China61170242
2016-06-01(万方平台首次上网日期,不代表论文的发表时间)
共8页
459-466