10.3321/j.issn:1002-8331.2003.11.022
统计语言模型中词的自动聚类技术研究
为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的Class N-gmm模型,该文研究了汉语词的自动聚类技术,提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大提高了聚类算法的工作效率.
统计语言模型、聚类算法、评价函数、语义分类体系
39
TP391.2(计算技术、计算机技术)
国家高技术研究发展计划863计划863-306-03-02-1
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
69-70,152