10.3969/j.issn.1006-2475.2014.04.020
基于聚类的双说话人混合语音分离
针对许多基于训练模型的计算机听觉场景分析系统,在解决双说话人混合语音信号分离时需要依赖样本训练的有效性以及说话人的先验知识,提出一种基于聚类的单声道混合语音分离系统.系统先利用多基音跟踪算法对语音信号进行分析并产生同时流,然后通过最大化类内散布矩阵与类间散布矩阵的迹,搜索同时流的最佳分类,最终完成对双说话人的语音分离.该系统不需要训练语音模型,并且有效地改善了在双说话人混合语音信号的分离效果,为双说话人的语音分离提供了新的思路.
计算机听觉场景分析、双说话人语音分离、聚类
TP391(计算技术、计算机技术)
2014-06-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
86-88