10.3772/j.issn.1002-0470.2009.02.002
基于后验概率的汉语语音检索方法研究
针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法.该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度.后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息.语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法.
汉语语音检索、音节lattice、后验概率、检索模型、邻接矩阵
19
TP3;TN9
国家自然科学基金60575030;863计划2006AA01Z197
2009-04-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
119-124