10.3969/j.issn.2095-2163.2018.05.008
基于深度学习的环境声音识别
作为一种感知周围环境十分有效的方法,环境声音识别(Environment Sound Recognition,ESR)被广泛地应用在机器人导航、移动机器人、音频检索、音频取证以及其它基于情景感知、可穿戴的应用中.目前,较为简单的分类器已经大规模应用在ESR问题中,但却不能很好地反映和识别环境声音,而深度神经网络作为一种高性能、多层的神经网络,为更好地描述原始数据特征和解决模式识别问题提供了更有效的途径.为此,本文将深度神经网络应用在环境声音识别问题中,并对音频特征进行特征融合,通过训练深度信念网络(Deep Belief Network,DBN)进行环境场景的识别.实验结果表明,基于特征融合的方法的识别性能相较于分别采用音频特征的方法识别在性能上有明显提升,且将深度学习应用在ESR问题中具有明显的优势.
环境声音识别、特征融合、深度学习
8
TP391.41(计算技术、计算机技术)
国家自然科学基金91120303
2018-08-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
34-37,41