面向鲁棒自动语音识别的一致性自监督学习方法
提出了一种基于一致性自监督学习的鲁棒自动语音识别方法.该方法通过使用语音信号仿真技术,模拟一条语音在不同声学场景下的副本;在通过自监督学习方式学习语音表征的同时,极大化一条语音在不同声学环境下对应语音表征的相似性,从而获取到与环境干扰无关的语音表征方式,提高下游语音识别模型的性能.在远讲数据集CHiME-4和会议数据集AMI上的实验表明,所提的一致性自监督学习算法能够取得相比已有的wav2vec2.0自监督学习基线算法30%以上的识别词错误率下降.这表明,所提方法是一种获取噪声无关语音表征、提升鲁棒语音识别性能的有效方法.
语音信号处理、语音识别、鲁棒语音识别、自监督学习
48
G633.41;TP391;H319
国家重点研发计划2020AAA0108002
2023-06-08(万方平台首次上网日期,不代表论文的发表时间)
共10页
578-587