10.7544∕issn1000-1239.2020.20190180
基于特征融合时序分割网络的行为识别研究
行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3 D卷积为主;而特征选择直接影响到识别的效率,多层次的特征融合工作还有很多问题有待解决.针对主流的双流卷积网络输入数据为 RGB图像和光流图像的局限,利用低秩空间中稀疏特征能够有效捕捉视频中运动物体信息的特点,对网络输入数据进行补充.同时,针对网络中缺乏信息交互的特点,将深度网络中高层语义信息和低层细节信息结合起来共同识别行为动作,使时序分割网络性能更具优势.在行为识别数据集 UCF101 和 HMDB51 上取得了97.1%和 76.7%的识别效果,较目前主流算法有了较大的提升.实验结果表明,该方法能够有效地提高行为识别的识别率.
行为识别、稀疏特征、时序分割网络、双流卷积网络、特征融合
57
TP391(计算技术、计算机技术)
国家自然科学基金项目;教育部产学研合作协同育人基金项目;中国交通教育研究会教育科学研究课题;南通市科技计划资助项目;南京大学计算机软件新技术国家重点实验室基金项目;江苏省研究生科研与实践创新计划项目;南通大学-南通智能信息技术联合研究中心基金项目
2020-03-17(万方平台首次上网日期,不代表论文的发表时间)
共14页
145-158