10.19573/j.issn2095-0926.202204010
基于视频关键帧提取和三维卷积的行为识别
为提高行为识别的准确率,在C3D网络模型的基础上,提出一种基于视频关帧提取的三维卷积网络模型.该模型采用C3D网络模型的卷积层部分,结合CBAM注意力机制对人体行为视频提取特征进行行为识别;针对人体行为视频处理部分,采用视频聚类关键帧提取算法,对UCF101 数据集进行关键帧提取,改善了原始模型不易关注视频中人体行为的关键帧情况,并利用水平翻转的方法对已经提取的关键帧进行数据增强.实验结果表明:本文提出的算法比原始C3D模型在UTF101 数据集上的准确率(accuracy)提高了 29.35%,网络中的参数量(params)比原有的C3D模型减少了 26.06×106,性能也较其他常用方法有明显的提高.
行为识别、深度学习、三维卷积、关键帧提取
32
TP183(自动化基础理论)
天津市自然科学基金资助项目18JCYBJC84900
2023-07-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
51-56