10.16652/j.issn.1004-373x.2019.08.035
基于多特征组合的普通话塞音识别
针对汉语塞音发音易混淆、变化速率快等不易识别的问题,提出在语音和声学特征基础上,加入其他特征参数来提高汉语塞音的识别性能.提取的参数包括嗓音起始时间(VOT)、音轨方程、发音器官运动轨迹位移、速度和加速度的运动学特征,并将提取的声学和运动学特征进行融合,形成不同的特征组合;再分别对特征组合进行主成分分析(PCA)和信息熵计算;最后通过SVM识别网络,测试特征组合的识别性能.测试结果显示,通过PCA后特征组合识别率排名Top-10的组合与熵计算后的特征组合排名一致,表明特征组合识别塞音的稳定性;且与单组特征相比,Top-10特征组合识别率都有提高,PCA后其识别率最高达到97.45%.
塞音识别、参数提取、特征组合、主成分分析、运动学特征、声学特征
42
TN912.34-34
山西省基础研究计划项目2013021016-1;山西省科技攻关社会发展项目20120313013-6
2019-06-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
159-163