10.3321/j.issn:1002-0470.2006.02.004
一种基于相似度的汉语语言模型平滑技术及其在音字转换中的应用
针对汉语语言模型中的数据稀疏问题,利用词语语义信息,将词语相似度同back-off平滑技术相结合,提出一种基于词语相似度的汉语语言模型平滑技术,并且设计了一种能够自动优化模型中各项参数的迭代算法,最后,将这种平滑技术由低阶语言模型推广到高阶语言模型中,将上述技术应用到音字转换领域.实验表明,这项技术使语言模型的性能获得了较大的提高,并有效地降低了音字转换系统的错误率.
数据稀疏、语言模型、平滑、音字转换、知网
16
TN92
中国科学院资助项目60435020;国家科技攻关项目2002AA117010-09
2006-04-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
127-132