基于深度神经网络的英语口语语音识别系统设计
文章提出一种结合长短期记忆网络(Long Short-Term Memory,LSTM)、卷积神经网络(Convolutional Neural Network,CNN)和连接主义时间分类(Connectionist Temporal Classification,CTC)的端到端英语口语识别模型.该模型直接对语音特征序列建模,无须中间表示,简化识别系统设计,为口语识别与交互技术发展奠定基础.此外介绍了如何在树莓派上实现基于深度神经网络的英语口语语音识别系统.由于系统的模式可以不断地改进识别精度,因此非常方便用于家居中进行英语口语自学检测.
英语口语识别、LSTM、CNN、CTC、端到端
19
TP391;TN918.91;TP183
福建省中青年教师教育科研项目;福建省大学生创新创业训练计划项目
2023-08-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
77-79