10.3969/j.issn.1671-1815.2019.02.028
基于改进的长短期记忆神经网络方言辨识模型
在案件侦破中, 方言的辨别能提供重要线索.为了对汉语方言进行辨别, 基于长短期记忆神经网络 (LSTM) 的方言辨识模型被提出, 语音样本数据, 其中包括地区口头禅, 均采集于贵州省6个地区, 并提取梅尔频率倒谱系数 (MFCC), 每份语音样本MFCC后面加上相应的地区口头禅MFCC, 然后采用滑窗进行信息重叠分块, 对每块分别进行横向与纵向奇异值分解并保留高贡献率的特征向量, 把分块合并作为方言辨识模型的输入数据.先对LSTM进行改进, 然后构建方言辨识模型.通过交叉实验对该模型进行训练和验证, 从而对滑窗的宽度进行优化, 同时与循环神经网络 (RNN) 进行比较.实验结果证明研究构建的LSTM模型对汉语方言辨识是高效的.
汉语方言辨识、梅尔频率倒谱系数、地区口头禅、奇异值分解、长短期记忆神经网络
19
TP391.42(计算技术、计算机技术)
贵州省科技计划 黔科合[2016]支撑2847 资助
2019-05-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
163-169