10.3778/j.issn.1002-8331.1407-0312
面向藏语语音合成的语音基元自动标注方法
在基于隐Markov模型(Hidden Markov Model,HMM)的统计参数藏语语音合成中引入了DAEM(Deterministic Annealing EM)算法,对没有时间标注的藏语训练语音进行自动时间标注。以声母和韵母为合成基元,在声母和韵母的声学模型的训练过程中,利用DAEM算法确定HMM模型的嵌入式重估的最佳参数。训练好声学模型后,再利用强制对齐自动获得声母和韵母的时间标注。实验结果表明,该方法对声母和韵母的时间标注接近手工标注的结果。对合成的藏语语音进行主观评测表明,该方法合成的藏语语音和手工标注声、韵母时间的方法合成的藏语语音的音质接近。因此,利用该方法可以在不需要声、韵母的时间标注的情况下建立合成基元的声学模型。
藏语语音合成、确定性退火期望值最大化(DAEM)算法、自动标注、时间标注
TP391(计算技术、计算机技术)
国家自然科学基金No.61263036;甘肃省杰出青年基金No.1210RJDA007;甘肃省自然科学基金No.1107RJZA112, No.1208RJYA078。
2015-03-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
199-203