10.3969/j.issn.1673-808X.2016.02.007
深度信念网络的Bottleneck特征提取方法
为了提升连续语音识别系统的识别率,提出一种基于深度信念网络的 Bottleneck 特征提取方法。该方法使用对比散度算法,采用无监督的预训练堆叠限制玻尔兹曼机得到网络初始化参数,进而采用反向传播算法,以最大化帧级交叉熵作为训练准则,反向迭代对网络参数进行微调。采用上下文相关的三音素模型,以音素错误率大小作为评价系统性能的准则。实验结果表明,所提出的基于深度信念网络提取的Bottleneck特征相对于传统特征更具优越性。
连续语音识别、深度信念网络、Bottleneck特征、音素错误率
36
TP391.4(计算技术、计算机技术)
广西自然科学基金2012GXNSFAA053221;广西千亿元产业产学研用合作项目信科院0618
2016-06-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
118-122