10.3969/j.issn.1673-808X.2008.03.007
汉语声调识别中的基音后处理方法
汉语是一种带有声调的语言,声调信息主要体现在韵母的基音轨迹中,但是由于提取的基音不够稳健,所以必须要对基音进行后处理.通过归纳以帧为单位和以韵母为单位的两类基音后处理方式,并在第一种方式中提出基于韵母平均值进行归一化算法,在第二种方式中提出了帧叠靠前和帧叠靠后的韵母四等分长算法,经实验结果(以标准HTK为平台)得出后者更优的结论.考虑到前后声调的影响,采用声调三音子模型进行声调识别测试,可以比单音子模型识别效果提高10%左右.
语音识别、声调识别、基音后处理、帧叠靠前/帧叠靠后四等分均值算法、声调三音子模型
28
TP391.42(计算技术、计算机技术)
北京凌声芯语音科技项目2008
2008-09-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
214-218