10.3969/j.issn.1671-1815.2022.26.033
基于改进线性预测基音频率的语音情感识别系统
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法.它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰.由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPC美尔倒频谱系数(LPC Mel cepstral coefficients,LPCMCC)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与支持向量机(support vector machines,SVM)的语音情感识别对比实验.对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%.为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统.实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感.
噪声干扰、线性预测基音频率、LPCMCC、SVM、改进特征、MATLAB GUI技术
22
TP391.9(计算技术、计算机技术)
国家自然科学基金62173049
2022-11-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
11524-11532