10.3321/j.issn:1002-8331.2007.20.009
视觉单通道唇读系统的有效性
在建立视觉单通道的大词汇量唇读系统中,提出了归一化的U-LDCT-KL两级唇读特征提取方法,即针对唇区分块的DCT(Discrete Cosine Transform)系数进行二级KL(Karhunen-Loeve Transform)去局域参数的交叠.此方法一方面提取了唇读的最有效的低级语义特征,男一方面更加合理地选择利用了特征的有效可区分性,使得用42维二级视觉特征,对特定人的唇动内容识别正确率达到77.8%.实验还证明了系统中分块的唇区DCT特征对的视觉单通道唇读系统是最有效的.
唇读、Discrete Cosine Transform(DCT)、Karhunen-Loeve Transform(KL)
43
TP39(计算技术、计算机技术)
黑龙江省自然科学基金E2005-29;教育部跨世纪优秀人才培养计划NCET-05-0334
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
28-30