面向多口音语音识别的声学模型重构
该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合,从而提高了重构后的声学模型的效率。实验表明:该方法在不降低对标准普通话的识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了9.25%和9.21%。
语音识别、多方言口音、可靠口音相关单元、声学模型重构
51
TN912.3
国家自然科学基金;教育部高等学校博士学科点专项科研基金
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
1161-1166