可变形特征图残差网络用于城市声音识别
针对城市声音识别过程中时频图像特征提取较困难的问题,提出一种可变形特征图残差网络用于城市声音识别.首先设计可变形特征图残差模块,包括偏移层与卷积层.偏移层将输入特征图的像素点移位,移位后的特征图通过快捷连接与卷积层提取到的特征图叠加,使网络集中在感兴趣的特征图区域采样,并向下级网络传递移位后特征图信息;其次设计可变形卷积残差网络;最后将该网络提取的特征与城市声音的梅尔倒谱系数融合,经压缩激励模块重标定后输入全连接层分类.在城市声音数据集上进行了实验,结果表明,与卷积神经网络的方法相比,该方法用于城市声音识别准确率提高5%以上.
可变形卷积、残差模块、残差网络、城市声音、对数梅尔谱图
32
TP391.41(计算技术、计算机技术)
国家科技惠民计划;红树林生态环境监测系统关键技术研究;集成应用示范
2020-12-03(万方平台首次上网日期,不代表论文的发表时间)
共10页
1853-1862