10.3321/j.issn:0469-5097.2002.02.002
一种音频辅助的视频分割方法研究
视频分割是视频结构化组织的基础.提出一种结合音频和视觉信息的视频分割新方法,即先对视频作基于边变化率的初步分割,然后提取音频的MFCC及其差分系数特征,利用广义似然比(GLR)距离对音频信息进行相似性比较,并检测相应的音频变化点.在此基础上,应用音频分割点对初步的视频分割进行验证,获得具有一定语义内容的视频段.实验结果表明,方法简单有效,与单一的基于视觉信息的分割方法相比,获得的视频片段语义信息更为完整,同时也避免了分割的过度细碎.
视频分割、Hausdarff距离、边变化率、广义似然比、MFCC系数
38
TP391.4(计算技术、计算机技术)
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
139-144