基于动态贝叶斯网络的音视频联合说话人跟踪
将多传感器信息融合技术用于说话人跟踪问题,提出了一种基于动态贝叶斯网络的音视频联合说话人跟踪方法.在动态贝叶斯网络中,该方法分别采用麦克风阵列声源定位、人脸肤色检测以及音视频互信息最大化三种感知方式获取与说话人位置相关的量测信息;然后采用粒子滤波对这些信息进行融合,通过贝叶斯推理实现说话人的有效跟踪;并运用信息熵理论对三种感知方式进行动态管理,以提高跟踪系统的整体性能.实验结果验证了奉文方法的有效性.
说话人跟踪、动态贝叶斯网络、粒子滤波、麦克风阵列
34
TP391(计算技术、计算机技术)
国家自然科学基金60772161,60372082
2008-11-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
1083-1089