10.3778/j.issn.1002-8331.1605-0240
面向哈萨克语LVCSR的语言模型构建方法研究
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率.N-gram统计语言模型是目前广泛使用的语言模型之一.从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统.分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价.
哈萨克语、语言模型、语音识别、语料库构建、文本处理
52
TP391(计算技术、计算机技术)
国家自然科学基金61462084,61363063;新疆少数民族科技人才特培计划项目201523132
2017-01-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
178-181