面向大语料库的语音合成方法研究

引用

摘要：

针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法.首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注.然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度.主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升.

关键词：语音数据筛选、声学模型训练、基于HMM的单元挑选与波形拼接

所属期刊栏目：50

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金91120001,61121002;国家社会科学基金重大项目12&ZD119;国家重点基础研究发展计划2013CB329304

在线出版日期：2017-01-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：791-796

英文信息展示

期刊专题