期刊专题

10.16652/j.issn.1004-373x.2023.21.007

基于改进语谱图的深度学习说话人识别

引用
为了提高说话人识别系统的性能,提出基于改进语谱图的深度学习说话人识别算法.语谱图当中包含了语音的内容、情绪、语种以及说话人身份等多种信息,在以往的说话人识别算法中,往往没有考虑到说话人身份特性,采用直接提取语音中的语谱图作为网络输入,而说话人识别系统中需要提取语谱图中表征身份的信息,因此需要在原始语谱图的基础上进行改进.在语谱图中,基音频率以及共振峰等信息最能表现说话人的身份特征,从而提出根据语音信号中每一帧的基音频率进行自适应梳状滤波,得到改进后的语谱图,再通过卷积神经网络提取说话人特征,从而达到提升识别准确率的效果.网络模型采用MobileNetv2神经网络,该网络模型具有模型参数少、收敛速度快、识别速度快等优点,有利于实际应用.在对照实验结果中,该方法相对于原始语谱图的准确率分别提高了2.3%、5.2%、3%.

语谱图、基音频率、梳状滤波器、深度学习、说话人识别、深度可分离卷积

46

TN912.34-34;TP183

2023-11-08(万方平台首次上网日期,不代表论文的发表时间)

共7页

32-38

暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

46

2023,46(21)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn