期刊专题

10.15938/j.jhust.2017.03.003

数据不充分情况下的说话人识别

引用
在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法.目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据.而这一要求在现实应用中通常难以满足,导致其识别率急剧降低.针对这一问题,提出了一种基于稀疏编码的说话人识别方法.该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分.实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果.

说话人识别、高斯混合、支持向量机、稀疏编码

22

TN912.3

国家自然科学基金61305001;教育部博士点基金20132303120003;中国博士后基金2013M531042;黑龙江省博士后基金LBH-Z13099;黑龙江教育厅科学技术研究项目12511096;黑龙江自然科学基金F200936

2017-09-20(万方平台首次上网日期,不代表论文的发表时间)

共6页

13-18

暂无封面信息
查看本期封面目录

哈尔滨理工大学学报

1007-2683

23-1404/N

22

2017,22(3)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn