早晚期混响划分对理想比值掩蔽在语音识别性能上的影响
真实环境中存在的噪声和混响会降低语音识别系统的性能.封闭空间中的混响包括直达声、早期反射和后期混响3部分,它们对语音识别系统具有不同的影响.我们研究了早期反射和后期混响的不同划分方法,以其中的早期反射为目标语音,计算出了不同的理想比值掩蔽并研究了它们对语音识别系统性能的影响;在此基础上,利用双向长短时记忆网络(BLSTM)估计理想比值掩蔽,测试它们对语音识别系统性能的影响.实验结果表明,基于Abel早期反射和后期混响的划分方法,理想比值掩蔽能够降低词错误率约2.8%;基于BLSTM的估计方法过低估计了理想比值掩蔽,未能有效提高语音识别系统的性能.
识别性能、晚期混响、语音识别系统、划分对、双向长短时记忆网络、blstm、系统性能、划分方法、封闭空间、词错误率
44
TP301.6;TN912.34;O657.3
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家重点研发计划;国家重点研发计划;国家重点研发计划;新疆维吾尔自治区科技攻关计划
2019-08-06(万方平台首次上网日期,不代表论文的发表时间)
共8页
788-795