DOI：10.11896/j.issn.1002-137X.2018.09.052

基于多语言语音数据选择的资源稀缺蒙语语音识别研究

引用

摘要：

利用多语言信息可以提高资源稀缺语言识别系统的性能.但是,在利用多语言信息提高资源稀缺目标语言识别系统的性能时,并不是所有语言的语音数据对资源稀缺目标语言语音识别系统的性能提高都有帮助.文中提出利用长短时记忆递归神经网络语言辨识方法选择多语言数据以提高资源稀缺目标语言识别系统的性能;选出更加有效的多语言数据用于训练多语言深度神经网络和深度Bottleneck神经网络.通过跨语言迁移学习获得的深度神经网络和通过深度Bottleneck神经网络获得的Bottleneck特征都对提高资源稀缺目标语言语音识别系统的性能有很大的帮助.与基线系统相比,在插值的Web语言模型解码条件下,所提系统的错误率分别有10.5％和11.4％的绝对减少.

关键词：数据选择、资源稀缺、多语言深度神经网络、深度Bottleneck神经网络

所属期刊栏目：45

分类号：TP391.42(计算技术、计算机技术)

资助基金：国家自然科学基金61305027 ,山东省自然科学基金ZR2011FQ024 ,山东省高等学校科技计划项目J17KB160

在线出版日期：2018-10-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：308-313

英文信息展示

期刊专题