10.3321/j.issn:0371-0025.2008.05.011
一种适于说话人识别的非线性频率尺度变换
传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分.通过分析语旨信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换.实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%.这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能.
说话人识别系统、非线性、频率尺度变换、个性特征、短时谱、最小二乘法、多项式曲线、识别性能、听觉系统、拟合技术、感知特性、测试条件、误识率、增强、语音、语义、影响、训练、信号、提高
33
TN9;TP3
2008-10-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
450-455