10.11896/j.issn.1002-137X.2017.08.045
融合距离度量和高斯混合模型的中文词义归纳模型
词义归纳是解决词义知识获取的重要研究课题,利用聚类算法对词义进行归纳分析是目前最广泛采用的方法.通过比较K-Means聚类算法和EM聚类算法在各自词义归纳模型上的优势,提出一种新的融合距离度量和高斯混合模型的聚类算法,以期利用两种聚类算法分别在距离度量和数据分布计算上的优势,挖掘数据的几何特性和正态分布信息在词义聚类分析中的作用,从而提高词义归纳模型的性能.实验结果表明,所提混合聚类算法对于改进词义归纳模型的性能是十分有效的.
词义归纳、距离度量、高斯混合模型、混合聚类
44
TP391(计算技术、计算机技术)
重庆市教委科学技术研究项目kj1500920,kj1500916;国家自然科学基金项目61603065
2017-10-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
265-269