10.3969/j.issn.1006-2475.2023.01.011
混合多尺度卷积结合双层LSTM语音情感识别
针对深度学习算法在语音情感特征提取方面的不足以及识别准确率不高的问题,本文通过提取语音数据中有效的情感特征,并将特征进行多尺度拼接融合,构造语音情感特征,提高深度学习模型对特征的表现能力.传统递归神经网络无法解决语音情感识别长时依赖问题,本文采用双层LSTM模型来改进语音情感识别效果,提出一种混合多尺度卷积与双层LSTM模型相结合的模型.实验结果表明,在中科院自动化所汉语情感数据库(CASIA)和德国柏林情感公开数据集(Emo-DB)下,本文所提语音情感识别模型相较于其他情感识别模型在准确率方面有较大提高.
语音情感识别、深度学习、神经网络、多尺度卷积、长短时序网络
TP398.1(计算技术、计算机技术)
新疆维吾尔自治区创新环境建设专项人才专项计划;国家自然科学基金
2023-03-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
63-68