10.3778/j.issn.1002-8331.2011.21.037
新疆非母语汉语语音识别中的字典自适应技术
将标准普通话语音数据训练得到的声学模型应用于新疆维吾尔族说话人非母语汉语语音识别时,由于说话人的普通话发音存在较大偏误,将导致识别率急剧下降.针对这一问题,将多发音字典技术应用于新疆维吾尔族说话人汉语语音识别中,通过统计分析识别器的识别错误,建立音素混淆矩阵,获取音素的发音候选项.利用剪枝策略对发音候选项进行剪枝整合,扩展出符合维吾尔族说话人汉语发音规律的替代字典.对三种剪枝方法产生的发音字典的识别结果进行了对比.实验结果表明,使用相对最大剪枝策略产生的发音字典可以显著提高系统识别率.
发音字典、音素混淆矩阵、剪枝策略、新疆维吾尔族说话人、非母语汉语语音识别
47
TN912.34
国家自然科学基金the National Natural Science Foundation of China under Grant 60965002;新疆高校科研计划培育基金XJEDU2008S 15;新疆大学博士科研启动基金BS090143
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
141-144,216