DOI：10.3772/j.issn.1002-0470.2009.02.002

基于后验概率的汉语语音检索方法研究

引用

摘要：

针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法.该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度.后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息.语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法.

关键词：汉语语音检索、音节lattice、后验概率、检索模型、邻接矩阵

所属期刊栏目：19

分类号：TP3;TN9

资助基金：国家自然科学基金60575030;863计划2006AA01Z197

在线出版日期：2009-04-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：119-124

英文信息展示

期刊专题