DOI：10.3321/j.issn:0469-5097.2006.01.008

基于修正MFCC参数汉语耳语音的话者识别

引用

摘要：

耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的Mel倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Lg,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率.

关键词：耳语音、话者识别、MFCC参数、隐马尔可夫模型

所属期刊栏目：42

分类号：TN912.34

资助基金：国家自然科学基金60272037,60340420325

在线出版日期：2008-05-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：54-62

英文信息展示

期刊专题