10.3321/j.issn:0469-5097.2006.01.008
基于修正MFCC参数汉语耳语音的话者识别
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的Mel倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Lg,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率.
耳语音、话者识别、MFCC参数、隐马尔可夫模型
42
TN912.34
国家自然科学基金60272037,60340420325
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
54-62