10.3969/j.issn.2095-2163.2020.12.002
基于快速近似时序池化的端到端声学事件识别
声学事件识别系统的性能很大程度上取决于音频特征学习的有效性.由于音频信号属于时序性信号,要获得有效的音频特征,就需要提取其中的时序信息.作者曾提出了一种有效的时序性特征学习方法:时序池化.然而,由于其需要求解一个没有闭式解的优化问题,导致无法灵活地运用在当前流行的深度学习框架之中.为此,本文在保留时序池化的前提下,提出了一种计算方式更为简单的快速近似时序池化方法.基于此方法又进一步提出一种用于解决端到端声学事件识别问题的卷积神经网络.实验结果表明,所提出的网络可以取得比目前大多数方法更好的识别性能.
声学事件识别、音频特征学习、时序池化、卷积神经网络
10
TP391.41(计算技术、计算机技术)
国家重点研发项目;国家自然科学基金
2021-04-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
1-5,11