10.3969/j.issn.1672-948X.2009.06.018
基于MFCC等组合特征的说话人识别模型
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%~8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%~3%.
说话人识别、Mel倒谱系数、基音轮廓特征、语音活性检测
31
TN912
湖北省教育厅科学技术研究计划重大项目"基于真实感知的多方虚拟工作环境关键技术研究"Z20081301
2010-03-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
77-79,93