10.3969/j.issn.1002-137X.2007.01.030
多模态体育视频语义分析
以足球运动为例提出了一种体育视频语义结构,并提出相应的语义分析框架.视频被分解为纯视频流和音频流两种模态,每种模态均可依次提取和综合出低层内容和中层内容.视频流可根据低层(物理)内容分割为物理镜头,然后根据特定的中间层内容可以确定为语法镜头.音频也可以在物理特征的基础上形成有意义的中间层内容,如解说员兴奋时的声音.最后,根据视频流和音频流的中间层内容,按照足球比赛转播的规律,分析出比赛中的精彩事件,并选取相关的镜头作为反映此事件的序列组合.
体育视频、多模态、语义分析、语法镜头
34
TP3(计算技术、计算机技术)
国家自然科学基金60473117
2007-03-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
109-111