期刊专题

10.19573/j.issn2095-0926.202204010

基于视频关键帧提取和三维卷积的行为识别

引用
为提高行为识别的准确率,在C3D网络模型的基础上,提出一种基于视频关帧提取的三维卷积网络模型.该模型采用C3D网络模型的卷积层部分,结合CBAM注意力机制对人体行为视频提取特征进行行为识别;针对人体行为视频处理部分,采用视频聚类关键帧提取算法,对UCF101 数据集进行关键帧提取,改善了原始模型不易关注视频中人体行为的关键帧情况,并利用水平翻转的方法对已经提取的关键帧进行数据增强.实验结果表明:本文提出的算法比原始C3D模型在UTF101 数据集上的准确率(accuracy)提高了 29.35%,网络中的参数量(params)比原有的C3D模型减少了 26.06×106,性能也较其他常用方法有明显的提高.

行为识别、深度学习、三维卷积、关键帧提取

32

TP183(自动化基础理论)

天津市自然科学基金资助项目18JCYBJC84900

2023-07-24(万方平台首次上网日期,不代表论文的发表时间)

共6页

51-56

相关文献
评论
暂无封面信息
查看本期封面目录

天津职业技术师范大学学报

2095-0926

12-1423/Z

32

2022,32(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn