10.3969/j.issn.2095-2163.2013.06.024
一种识别说话者的新方法
在能够自动识别视频中的说话者的系统中,大部分采用的是声音和唇部运动相结合的方法.文中则采用了另一种方法有效地达到了目的,即通过检测人体头部和手部的运动来鉴别说话者.基于演讲者在说话时通常会伴有头部运动或是手部运动,该方法既能实现说话者的检测,又能避免由于观测点过远而导致无法判断人唇部运动的局限性.在系统的实施过程中,运用了多种图像处理方法,并且对三帧差运动法做出了改善,使其能更高效、更准确地检测到头部和手部的运动.经过多个不同的视频测试后,本系统的F1score高达91.91%,从而验证了该系统的可行性.
图像处理、脸部检测、手部检测、运动检测、F1score
3
TP391.4(计算技术、计算机技术)
2014-03-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
85-87