10.3321/j.issn:0371-0025.2008.01.001
汉语语音识别中基于区分性权重训练的声调集成方法
提出一种区分性方法,将声调信息加入大词汇量连续语音识别系统中.该方法根据最小音子错误准则,区分性地训练模型相关的概率权重.利用这些权重对传统基于传统谱特征的隐马尔可夫模型概率以及声调模型概率进行加权,通过调整模型之间的作用程度提高系统识别率.推导了利用扩展Baum-Welch算法的权重更新公式.对不同模型权重组合策略进行了评估,并利用权重之间的平滑方法来克服权重训练过拟合的问题.分别通过大词汇连续语音的带调音节输出和汉字输出两种识别任务来验证区分性模型权重训练的性能.实验结果表明在两种识别任务上,区分性的模型权重较使用全局模型权重分别获得9.5%以及4.7%的相对误识率降低.这表明了区分性模型权重对提高声调集成性能的有效性.
汉语语音识别、区分性模型、权重训练、集成方法、speech recognition、连续语音、隐马尔可夫模型、语音识别系统、概率权重、大词汇量、作用程度、组合策略、训练模型、集成性能、汉字输出、声调模型、权重更新、平滑方法、调整模型、误识率
33
O4(物理学)
2008-04-21(万方平台首次上网日期,不代表论文的发表时间)
共8页
1-8