基于编解码残差的人体关键点匹配网络
人体姿态估计尤其是多人姿态估计逐渐渗透到教育、体育等各个方面,精度高、轻量级的多人姿态估计更是当下的研究热点.自下而上的多人姿态估计方法的实时性较强,但是精度一般不高,网络结构也比较庞大.对于自下而上方法中最困难的一步——关键点关联问题,文中提出了一种轻量高效的姿态估计匹配网络.该网络在编码阶段将基础ResNet模块加以改进得到层结构,利用这些结构提取特征能够使得模型的参数量大幅减少;在解码阶段采用了特殊设计的反卷积结构,并在全网络添加了残差连接,这使得网络精度有很大的提升.整个算法能够将所有检测出来的关键点热图正确匹配到每一个人,得出最终的人体关键点估计.所提模型是一个轻便、高效的人体关键点匹配网络,它在COCO数据集地面真值上的mAP值高达89.7,而且参数只有8.01 M.这个结果相比目前最好的自下而上的人姿态估计方法在精度mAP值上提高了0.5,但是参数量仅为其1/10左右.所提网络利用COCO 2017和COCO 2014的地面真值分别进行了训练和验证,都取得了很高的精度,这证明其适合多种人体关键点热图的输入,并能够得到很好的效果.此外,文中针对网络模型的不同层结构设计了多种消融实验,最轻量的结构参数只有1.28兆,精度mAP值能够达到81.8.
人体姿态估计、匹配算法、热图、mAP值、COCO数据集
47
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项资金;国家自然科学基金联合基金项目
2020-07-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
114-120