10.3772/j.issn.1002-0470.2020.01.005
基于深度学习的动态场景相机姿态估计方法
针对现有增强现实技术中应用较为广泛的基于标识物的定位注册方法的不足,提出了一种在不断变化运动的复杂动态场景下估计相机连续运动的3维姿态的方法.基于深度神经网络对输入图像序列建立端到端的学习模型,将卷积神经网络(CNN)作为高层特征提取器,同时利用长短期记忆神经网络(LSTM)建立视频连续帧之间的时序关系,完成相机连续运动的3维姿态估计,从而避免了相机快速运动及场景不断运动变换导致图像特征提取效果不好的情况.另一方面,通过迁移学习的方法来预测未知视频序列的相机3维姿态信息,解决了原始数据量不够的问题.在公共数据集上的实验结果表明,相对于PoseNet,基于连续视频序列的输入,其预测精度得到一定的提升.
姿态估计、卷积神经网络(CNN)、长短期记忆神经网络(LSTM)、动态场景、迁移学习
30
国家重大科技专项2017ZX05019005
2020-04-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
41-47