10.3969/j.issn.1006-2475.2019.11.015
基于3D卷积神经网络的动态手势识别
传统的2D卷积神经网络在进行视频识别时容易丢失目标在时间维度上的相关特征信息,导致识别准确率降低.针对该问题,本文采用3D卷积网络作为基本的网络框架,使用3D卷积核进行卷积操作提取视频中的时空特征,同时集成多个3D卷积神经网络模型对动态手势进行识别.为了提高模型的收敛速度和训练的稳定性,运用批量归一化(BN)技术优化网络,使优化后的网络训练时间缩短.实验结果表明,本文方法对于动态手势的识别具有较好的识别结果,在Sheffield Kinect Gesture(SKIG)数据集上识别准确率达到98.06%.与单独使用RGB信息、深度信息以及传统2D CNN相比,手势识别率均有所提高,验证了本文方法的可行性和有效性.
3D卷积神经网络、光流、集成学习、深度学习、动态手势识别
TP391.41(计算技术、计算机技术)
2019-11-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
75-80