10.3969/j.issn.1671-1815.2019.01.028
基于改进卷积神经网络与动态衰减学习率的 环境声音识别算法
环境声音识别在音频检索、监控方面有着广泛的应用,是听觉识别任务中的一个热门研究领域.但由于声音信号的复杂多变,使得该任务在识别率提升方面依然面临许多挑战.针对这一问题提出了基于改进卷积神经网络的环境识别模型(S-CNN),该模型采用反复堆叠的递减型卷积核提取不同尺度的局部特征,并在每层卷积层后采用batch normalization(BN)层对特征进行归一化操作.同时,利用动态衰减的学习率训练模型,以提高模型收敛速度与收敛稳定性.实验结果表明,相比于传统的机器学习与卷积神经网络模型,本文所设计的改进卷积神经网络模型S-CNN具有更好的识别率.在ESC-10环境声音数据库上,识别精度达到91.3%.
环境声音识别、特征提取、卷积神经网络、深度学习
19
TP391.42(计算技术、计算机技术)
国家自然科学基金51475097, 91746116;贵州大学面向智能装备领域的"技术众筹"研究生创新基地项目JSZC[2016]001
2019-03-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
177-182