10.3778/j.issn.1002-8331.1504-0255
说话人聚类的初始类生成方法
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大.为了降低说话人聚类时的计算量,提出一种面向说话人聚类的初始类生成方法.提取说话人分割后语音段的特征参数及特征参数的质心,结合层次聚类法和贝叶斯信息准则,对语音段进行具有宽松停止准则的"预聚类",生成初始类.与直接对说话人分割后的语音段进行聚类的方法相比,该方法能在保持原有聚类性能的情况下,减少40.04%的计算时间;在允许聚类性能略有下降的情形下,减少60.03%以上的计算时间.
层次聚类、贝叶斯信息准则、说话人聚类、初始类、语音信号处理
53
TN912.3
国家自然科学基金61101160;广州市珠江科技新星专项2013J2200070;华南理工大学大学生课外创新训练项目;中央高校基本科研业务费本科生自主选题项目10561201501
2017-04-01(万方平台首次上网日期,不代表论文的发表时间)
共5页
149-153