10.3321/j.issn:0254-4164.2006.03.014
一种基于内容的音频流二级分割方法
基于内容的音频流分割是多媒体数据分析领域中的一个十分重要和困难的问题.目前大多数传统的音频流分割方法是基于小尺度音频分类的,但是这类分割方法普遍存在虚假分割点过多的缺点,严重影响了实际应用的效果.作者的研究表明,大尺度音频片段的分类正确率要明显高于小尺度音频片段的分类正确率,并且这个趋势与分类器选择无关.基于这个事实和减少虚假分割点的目的,作者提出了一种新的音频流分割方法.首先,采用基于大尺度音频分类的分割方法对音频流进行粗分割,以减少虚假分割点;然后定义了分割点评价函数,并利用它在边界区域中进一步精确定位分割点.实验结果表明这种音频流分割方法可以比较精确地获取分割点位置,同时将虚假分割点减少到传统方法的四分之一.
音频分类、音频流分割、分割点评价函数、虚假分割、神经网络
29
TP391(计算技术、计算机技术)
中国科学院资助项目60573060,60205002,60332010,60372020;北京市自然科学基金4042020
2006-04-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
457-465