期刊专题

10.16652/j.issn.1004-373x.2024.01.016

基于ResCNN-BiGRU的四川方言语音识别

引用
由于基于深度卷积神经网络的语音识别模型中缺乏对特定方言音素特征的提取能力,造成方言发音底层特征部分信息丢失,进而导致方言识别准确率不高、鲁棒性差等问题.针对上述问题,提出一种结合残差网络(RestNet)和双向门控循环网络(BiGRU)的模型,该模型以GFCC特征图为输入,同时在残差网络中设计多尺度卷积模块,通过不同大小的卷积核提取特征,然后使用双向门控循环网络捕捉序列数据中的长期依赖关系,最后采用连接时序分类算法进行标签软对齐,实现四川方言语音识别模型.在四川方言语料库上的实验结果表明,提出的模型识别性能优于现有基准模型.

四川方言、音素特征、双向门控循环网络、多尺度卷积、连接时序分类、标签软对齐

47

TN912.3-34

2024-01-08(万方平台首次上网日期,不代表论文的发表时间)

共5页

89-93

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

47

2024,47(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn