10.16652/j.issn.1004⁃373x.2021.12.012
基于改进TDNN的带噪声纹识别算法
针对时延神经网络算法(TDNN)在声纹识别过程中,随着神经网络深度的增加,存在梯度消失、网络退化以及在噪声环境下鲁棒性欠佳的问题,提出一种改进的时延神经网络算法(ResTDNN).该算法首先利用残差神经网络(ResNet)的输入层能对输出层进行不断修正以减少特征信息损失的特点,在TDNN网络结构中引入了残差神经网络,直接对TDNN网络结构进行修改,使得神经网络退化现象得到缓解并提高了声纹识别系统的鲁棒性.其次,在网络结构中利用批量归一化处理来减少内部协变量的移位,进而改善了梯度消失的现象.最后通过在Aishell数据集上的实验结果表明,与TDNN算法相比,ResTDNN算法在无噪声环境下及带噪声环境下的等错误率(EER)分别相对降低15.6%和35.8%,从而验证了噪声环境下ResTDNN算法用于声纹识别的有效性.
声纹识别、噪声环境、时延神经网络、网络结构、残差神经网络、批量归一化
44
TN912⁃34;TP391.4
贵州省科技计划;国家自然科学基金;贵州省科技计划;贵州师范大学博士科研项目
2021-06-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
53-58