数据不充分情况下的说话人识别
在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法.目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据.而这一要求在现实应用中通常难以满足,导致其识别率急剧降低.针对这一问题,提出了一种基于稀疏编码的说话人识别方法.该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分.实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果.
说话人识别、高斯混合、支持向量机、稀疏编码
22
TN912.3
国家自然科学基金61305001;教育部博士点基金20132303120003;中国博士后基金2013M531042;黑龙江省博士后基金LBH-Z13099;黑龙江教育厅科学技术研究项目12511096;黑龙江自然科学基金F200936
2017-09-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
13-18