期刊专题

10.16652/j.issn.1004-373x.2021.17.017

基于DNN-HMM和RNN的维吾尔语语音识别

引用
基于深层神经网络(DNN)的语音识别模型不仅在单个语言上表现出色,而且在多语言信息处理领域也表现出了优异的能力.随着语音数据量的增加,高斯混合模型(GMM)在有效提升大词汇量连续语音识别系统性能以及识别效果上被神经网络(NN)模型超越.文中采用Kaldi开源语音识别平台,结合RNN语言模型和DNN模型的三种损失函数,即最大互信息量(MMI)、最小贝叶斯风险(sMBR)和最小因素错误率(MPE),在维吾尔语语料库(THUYG-20公开语料库)测试数据上分别取得了16.73%,16.55%和15.95%的词错误率.相比高斯混合模型的词错误率分别降低了2.88%,3.06%和3.66%.深层神经网络在资源匮乏的少数民族语言以及多语言信息处理上有更强的能力.

维吾尔语语音识别;RNN语言模型;DNN-HMM;声学模型;判别式训练;损失函数;Kaldi

44

TN911.7-34;TP183

国家重点研发计划项目2017YFC0820602

2021-11-08(万方平台首次上网日期,不代表论文的发表时间)

共5页

90-94

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

44

2021,44(17)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn