10.3969/j.issn.1672-6251.2017.03.015
农产品信息采集作业场景下目标用户的语音识别研究
农产品信息采集场所通常以大型集贸批发市场为主,其语音场景又以单语言、多口音、多目标、高噪声为特点,在此特定领域开展语音识别应用研究的关键在于解决多语音数据集之间的声学、通道和环境的不匹配问题.本文考虑在小词汇量任务下,使用标准普通话和两种宁夏地方口音的数据,从目标用户群体中采集语音数据,在单语言多口音环境下分别训练连续概率密度隐马尔可夫模型(CDHMM)和子空间高斯混合模型(SGMM),通过基线实验对比了两种声学建模方法的性能特点.
语音识别、CDHMM、SGMM
TP3;S78
国家自然科学基金面上项目"农产品质量安全信息采集作业场景下的语音识别鲁棒性研究"61271364
2017-04-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
58-61