10.3778/j.issn.1002-8331.2012.17.031
有限状态矢量量化在语音端点检测中的应用
语音端点检测在语音处理中占有非常重要的地位,传统的检测方法是基于短时能量和过量率的双门限比较法,但是在信噪比较低的情况下,利用短时能量和过量率很难得到准确的检测结果.另外,在双门限比较法中,判别门限的取值对整个端点的检测影响很大,而这个门限值往往是靠经验所得,具有不稳定性.因此,针对传统方法的不足,根据语音帧间相关性,提出了一种改进算法.让语音信号通过双门限比较,完成端点检测的一级粗判,在语音起止点的模糊帧段,取一定范围的信号矢量,让这些矢量经过处理后再通过有限状态矢量量化器(FSVQ),得到量化矢量,再对量化矢量进行二级细判,从而得到准确的语音起止点.将改进算法应用于汉语连续数字语音识别,平均识别时间由原来的0.871 s缩短为0.719 s,平均识别率由原来的81.47%上升至89.13%,实验结果表明了该算法的有效性.
端点检测、有限状态矢量量化、语音识别
48
TP391.42(计算技术、计算机技术)
2012-07-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
161-164,169