DOI：10.3969/j.issn.1003-9775.2015.10.011

音频情感感知与视频精彩片段提取

引用

摘要：

为了将伴生音频数据的情感语义用于引导视频精彩片段的提取，提出一种音频感知驱动下的视频精彩片段提取方法。为提取伴生音频数据的情感语义，使用一个基于分层二叉树支持向量机的音频分类器提取中层音频类型，并集成了一个情感映射模型以感知高层情感语义；然后利用该前置音频情感感知模型实现伴生音频情感语义的波动分析，并进一步以精彩片段起止定位策略和音视频同步修订为辅助手段，实现视频精彩片段的定位。文中方法以音频数据情感语义波动序列为核心枢纽，以两阶段音频情感感知模型为前导分析，构建了一个完整的音频情感驱动下视频精彩片段提取架构。实验结果表明，在保证一定查准率的情况下，音频情感驱动下的视频精彩片段提取具有较好的通用性，较高的查全率以及完整度。

关键词：视频精彩片段提取、音频情感感知、情感语义、音频分类

分类号：TP391(计算技术、计算机技术)

资助基金：福建省自然科学基金2012J01262,2013J01231,2015J01420

在线出版日期：2015-10-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：1890-1899

英文信息展示

期刊专题