期刊专题

10.3321/j.issn:0371-0025.2008.05.011

一种适于说话人识别的非线性频率尺度变换

引用
传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分.通过分析语旨信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换.实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%.这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能.

说话人识别系统、非线性、频率尺度变换、个性特征、短时谱、最小二乘法、多项式曲线、识别性能、听觉系统、拟合技术、感知特性、测试条件、误识率、增强、语音、语义、影响、训练、信号、提高

33

TN9;TP3

2008-10-28(万方平台首次上网日期,不代表论文的发表时间)

共6页

450-455

相关文献
评论
暂无封面信息
查看本期封面目录

声学学报

0371-0025

11-2065/O4

33

2008,33(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn