基于融合特征MGCC的语种识别方法
为了解决噪声环境下语种识别准确率低的问题,提出一种将梅尔倒谱系数和伽马频率倒谱系数融合的语种识别方法.首先提取语音的梅尔倒谱系数和伽马频率倒谱系数,并依据语种识别中的贡献度对特征进行筛选;接着将特征映射在由梅尔域-伽马域组成的空间坐标系中,以得到梅尔伽马倒谱系数(MGCC);最后,将特征输入深度神经网络中进行语种识别.实验结果表明,所提方法的识别准确率和速度远高于使用单一声学特征及其他语种特征的方法.在纯净环境下,所提方法的语种识别准确率可以达到 99.38%,在-5dB低信噪比环境下也可达到89%以上.这充分证明了所提方法的有效性和鲁棒性.
语种识别、融合特征、深度神经网络、低信噪比、鲁棒性
46
TN912.34
国家自然科学基金61761025
2023-05-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
116-121