10.3969/j.issn.1001-7119.2013.06.024
基于MapReduce的分布式EM算法的研究与应用
EM(Expectation-Maximization)算法在机器学习和自然语言处理方面应用非常广泛。随着电子信息技术的高速发展,人们更加需要从大量的数据信息中提出更多有价值的知识,用于后续的研究工作。但是,传统的应用到机器学习等领域的EM算法不能有效地处理当今社会海量规模的数据。本文基于现有流行的MapReduce计算框架,提出了求解混合模型的分布式EM算法。该算法能够高效地完成极大似然估计。实验表明,本文提出的算法具有很好的加速比以及可扩展性。
EM算法、混合模型、MapReduce、云计算、分布式、机器学习
TP301.6(计算技术、计算机技术)
河南省科技攻关项目122102310412。
2013-07-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
68-70