10.3321/j.issn:1002-8331.2005.08.027
基于句子级的唇语识别技术
唇读是通过口型变化判断话者内容,唇读研究属于人机交互范畴.识别在生物界大体包括两个方面,人物身份的鉴别和基本内容的认知.现阶段唇读的研究主要是基于说话者内容的识别,对采集的话者唇动图像序列进行有效的预处理(包括视频切割,图像增强,唇边缘定位),预处理后如何选择合适的特征是解决识别准确性的关键问题,在唇读识别研究中采用了基于口型变化序列的形状特征和图象特征进行实验.最后采用半连续hmm模型完成计算机唇语识别.
半连续隐马尔可夫模型、唇读、口型序列
41
TP391.41(计算技术、计算机技术)
2005-04-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
86-88