双哈希索引的高精度大规模音频样例检索
实时音频流中对大规模音频样例进行检索时,在保证准确率的条件下,检索速度直接影响音频流实时处理能力.提出一种基于双哈希索引的大规模音频样例检索方法.该方法通过对大规模音频样例的音频特征进行自相似量化后,分别根据自相似序列的分段向量均值和模值建立线性双哈希索引,然后在音频流中进行搜索,最后对搜索结果利用音频的时序和空间信息进行判断得到检索结果.实验结果表明,本方法实现了大规模音频样例的一次检索,且当采用12维MFCC音频特征,音频样例时长为16 s、音频样例规模小于3100时,音频样例的检索准确率在90%以上,检索速度大于12000倍速,最高达到16000倍速.该方法在有效提高检索精度的基础上,保证较高的检索速度.
40
2015-11-30(万方平台首次上网日期,不代表论文的发表时间)
886-893