10.3778/j.issn.1002-8331.1909-0105
基于非局部3D残差网络的视频指纹算法
为了实现视频拷贝的快速准确检索,提出一种基于非局部3D残差网络的紧凑视频指纹.该算法以三胞胎网络架构为基础,采用非局部模块3D残差网络同时捕获视频的全局与局部时空信息,在特征提取部分末端加入量化编码层,实现了原始视频数据到离散指纹码的端到端映射;设计了由角度关系三元组损失和量化误差损失组成的网络目标函数.大量的实验结果表明,与对比算法相比,该算法在保持紧凑的同时鲁棒性与独特性均表现突出,查准率与查全率有明显提升.
视频指纹、非局部模块、3D残差网络、三元组损失、量化误差损失
56
TP181;TP183;TP391.4(自动化基础理论)
国家自然科学基金;河南理工大学博士基金;河南省科技攻关项目
2020-10-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
216-223