10.16652/j.issn.1004-373x.2021.18.003
CNN边缘影响分析与改进的语音识别
大多数现有的关于卷积神经网络的语音识别方法注重于大规模数据的训练或网络模型的改进上,但是它们忽略了语音二维特征存在的几何问题.通过在选取数据集上对提取的梅尔倒谱系数相关特征进行实验,可以观察到多数的二维特征在卷积神经网络算法中存在边缘影响.该影响是指非零特征多集中在整个特征图的边缘区并且会造成语音特征在训练阶段中关键信息的丢失,从而大大降低语音识别的准确率.经过对该影响的进一步研究,采取了几种几何改进方法来减轻二维特征在卷积神经网络算法中的边缘影响.实验结果表明,各种改进后的二维语音特征相对于原始特征在正确率或鲁棒性上都有不同程度的优势.
语音识别;卷积神经网络;特征提取;数据获取;边缘效果分析;边缘影响
44
TN711-34(基本电子电路)
国家自然科学基金项目61703206
2021-11-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
11-16