10.3321/j.issn:1000-0054.2005.10.017
基于拼音图的两阶段关键词检索系统
针对当前关键词检索系统中单阶段系统检索速度慢,基于大词汇量连续语音识别(LVCSR)的两阶段系统又不够稳健的现状,提出一种新的基于拼音图的两阶段检索系统以满足快速、稳健检索的需要.两阶段分为预处理阶段和检索阶段.预处理阶段将语音数据识别成具有高覆盖率的拼音图.检索阶段响应用户的频繁查询,在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选.实验表明:系统的二字词召回率及正确率可达72.19%和72.68%,三字词召回率及正确率可达73.51%和82.98%,均优于LVCSR系统,且检索阶段仅需0.01倍实时,具有良好的实用价值.
信息检索、关键词检索、拼音图、置信度
45
TP391(计算技术、计算机技术)
国家网络和信息安全保障持续发展计划
2005-12-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
1356-1359