用于口型识别的实时唇定位方法
在许多应用于有噪声环境下的语音识别系统中,唇读技术能有效地降低噪声的影响,通过视觉通道来补充仅取决于听觉通道的信息量,从而提高语音识别系统的识别率.该文提出了一种有效和稳健的唇定位跟踪方法,以满足不用特殊标识物和规范性照明就能对信息进行有效提取的应用需求.该方法首先用肤色模型查找脸;然后用迭代算法搜索脸部区域内的眼睛;再根据眼睛的位置来确定脸的大小和位置,并对脸的下半部分采用彩色坐标变换法将唇从肤色中明显地区分出来;最后,用可变模板将上下唇的内外轮廓描述出来.
唇读、唇动、肤色模型、光流、可变模板
11
TP391(计算技术、计算机技术)
中国科学院资助项目69789301;国家科技攻关项目863-306-ZT03-01-2
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
1126-1132