基于改进BFDNN的远距离语音识别方法
针对复杂环境下远距离智能语音识别的问题,提出了一种基于深度神经网络(DNN)的波束形成与声学模型联合训练的改进方法.即首先提取麦克风阵列信号之间的多通道互相关系数(MCCC)来估计频域波束形成器权重,进而对阵列信号进行滤波得到增强信号,然后对增强信号提取梅尔滤波器组(Fbank)特征送入声学模型进行训练识别,最后再将识别信息反馈回波束形成网络(BFDNN)来更新网络参数.实验通过Theano与Kaldi工具箱结合搭建大词汇量远距离语音识别系统进行.仿真结果表明了该方法的有效性.
远距离语音识别、波束形成、麦克风阵列、MCCC、BFDNN
14
TN912.34
辽宁省科学事业公益研究基金项目20170056;辽宁省自然科学基金201302022
2018-07-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
182-185,191