10.11896/j.issn.1002-137X.2017.01.012
一种改进的多视图聚类集成算法
近年来,针对大数据的数据挖掘技术和机器学习算法研究变得日趋重要.在聚类领域,随着多视图数据的大量出现,多视图聚类已经成为了一类重要的聚类方法.然而,大多数现有的多视图聚类算法受算法参数设置、数据样本等影响,具有聚类结果不稳定、参数需要反复调节等缺点.基于多视图K-means算法和聚类集成技术,提出了一种改进的多视图聚类集成算法,其提高了聚类的准确性、鲁棒性和稳定性.其次,由于单机环境下的多视图聚类算法难以对海量的数据进行处理,结合分布式处理技术,实现了一种分布式的多视图并行聚类算法.实验证明,并行算法在处理大数据时的时间效率有很大提升,适合于大数据环境下的多视图聚类分析.
多视图聚类、聚类集成、分布式计算、并行化
44
TP391(计算技术、计算机技术)
国家自然科学基金61170111,61572407,61134002;国家科技支撑计划课题2015BAH19F02;四川省科技支撑计划项目2014SZ0207
2017-04-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
65-70