10.3969/j.issn.1002-137X.2005.09.044
几种小训练样本集的数字语音识别模型的比较性研究
本文通过对小训练样本集的基于DTW结构的数字语音识别模型的比较性分析,指出其存在的三个一般性问题:(1)DTW逐帧匹配模式割裂了观测向量序列的内在联系;(2)压扩观测向量序列造成局部信息使用的不均匀;(3)计算复杂度高,识别率低.为了解决这些问题,我们提出了基于数字语音时频信息整体结构的单特征向量识别模型.这种模型完整地利用了观测向量序列的全部信息,结合置信度评估和自适应反馈学习之后可及时地吸收测试向量携带的新的环境特征信息,调整识别模型结构.该模型的错识率较之最好的基于DTW结构的混合域模型的错识率降低50%以上,计算复杂度则是固定帧长模型的13.12%.
HMM、DTW、MFCC、观测向量、置信度评估、自适应反馈学习
32
TP3(计算技术、计算机技术)
2005-10-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
170-175