10.3969/j.issn.1000-310X.2008.03.003
一种基于模式识别的多路盲语音提取方法
盲分离算法能在缺少混合系统参数的条件下仅由观测信号估计初始源,但分离信号存在固有的排列模糊性,这往往导致两次批处理过程中同一信号"对不准",因此很难获得连续的源信号.本文针对盲声源分离中存在的相同问题,根据语音和其他音频信号的特征差异,提出一种修正的自相关函数并以其值作为一个特征基元来表征声音信号的时序相关特性,同时用平均声门波形状参数作为另一个特征基元来表征语音产生的生理效应.以这两个参数作为识别不同音频信号的二维模式特征,采用一种模糊聚类算法提取多路盲分离语音.本方法有效克服了批处理盲声源分离中的信号排列顺序的不确定性,并通过选择合适的阈值提取多路连续语音.仿真给出了5路混合音频信号中盲提取两路连续语音的实验结果.
盲分离、模式识别、语音
27
TN9;TP3
国家自然科学基金资助项目60672157,60672158
2008-07-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
173-180