10.11896/j.issn.1002-137X.2018.09.052
基于多语言语音数据选择的资源稀缺蒙语语音识别研究
利用多语言信息可以提高资源稀缺语言识别系统的性能.但是,在利用多语言信息提高资源稀缺目标语言识别系统的性能时,并不是所有语言的语音数据对资源稀缺目标语言语音识别系统的性能提高都有帮助.文中提出利用长短时记忆递归神经网络语言辨识方法选择多语言数据以提高资源稀缺目标语言识别系统的性能;选出更加有效的多语言数据用于训练多语言深度神经网络和深度Bottleneck神经网络.通过跨语言迁移学习获得的深度神经网络和通过深度Bottleneck神经网络获得的Bottleneck特征都对提高资源稀缺目标语言语音识别系统的性能有很大的帮助.与基线系统相比,在插值的Web语言模型解码条件下,所提系统的错误率分别有10.5% 和11.4% 的绝对减少.
数据选择、资源稀缺、多语言深度神经网络、深度Bottleneck神经网络
45
TP391.42(计算技术、计算机技术)
国家自然科学基金61305027 ,山东省自然科学基金ZR2011FQ024 ,山东省高等学校科技计划项目J17KB160
2018-10-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
308-313