10.3969/j.issn.1673-808X.2020.01.003
基于AOF-LCNN的语音回放攻击场景下的说话人识别算法
针对语音回放攻击场景下的LCNN说话人识别系统中存在的过拟合问题,提出一种基于AOF-LCNN的神经网络.设计了一个新的DNN结构分类器作为后端分类网络,将该DNN结构级联在LCNN网络之后,形成一套新的端到端网络结构.由于LCNN结构中的MFM结构可能是造成过拟合的原因,在DNN后端结构中采用LeakyReLU作为激活函数,以抵消MFM的过拟合影响.在ASVspoof 2017数据集上的结果表明,该算法在Dev数据集和Eval数据集上分别达到了3.59%和13.79%的等错误率(EER),相对LCNN系统的等错误率分别降低了2.12%和3.51%.该算法一定程度上解决了过拟合的问题,提高了系统的鲁棒性,同时降低了系统的等错误率,从而提高识别性能.
说话人识别、回放语音攻击、AOF-LCNN
40
TN912.34
新疆重点研发计划;桂林电子科技大学研究生教育创新计划
2020-09-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
13-17