面向哈萨克语LVCSR的语言模型构建方法研究

引用

摘要：

一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率.N-gram统计语言模型是目前广泛使用的语言模型之一.从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统.分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价.

关键词：哈萨克语、语言模型、语音识别、语料库构建、文本处理

所属期刊栏目：52

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61462084,61363063;新疆少数民族科技人才特培计划项目201523132

在线出版日期：2017-01-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：178-181

英文信息展示

期刊专题