DOI：10.3321/j.issn:0469-5097.2002.02.002

一种音频辅助的视频分割方法研究

引用

摘要：

视频分割是视频结构化组织的基础.提出一种结合音频和视觉信息的视频分割新方法,即先对视频作基于边变化率的初步分割,然后提取音频的MFCC及其差分系数特征,利用广义似然比(GLR)距离对音频信息进行相似性比较,并检测相应的音频变化点.在此基础上,应用音频分割点对初步的视频分割进行验证,获得具有一定语义内容的视频段.实验结果表明,方法简单有效,与单一的基于视觉信息的分割方法相比,获得的视频片段语义信息更为完整,同时也避免了分割的过度细碎.

关键词：视频分割、Hausdarff距离、边变化率、广义似然比、MFCC系数

所属期刊栏目：38

分类号：TP391.4(计算技术、计算机技术)

在线出版日期：2008-05-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：139-144

英文信息展示

期刊专题