基于编码-解码器架构的光场深度估计方法

引用

摘要：

针对现有光场深度估计方法存在的计算时间长和精度低的问题,提出了一种融合光场结构特征的基于编码-解码器架构的光场深度估计方法.该方法基于卷积神经网络,采用端到端的方式进行计算,一次输入光场图像就可获得场景视差信息,计算量远低于传统方法,大大缩短了计算时间.为提高计算精确度,网络模型以光场图像的多方向极平面图堆叠体(Epipolar Plane Image Volume,EPI-volume)为输入,先利用多路编码模块对输入的光场图像进行特征提取,再使用带跳跃连接的编码-解码器架构进行特征聚合,使网络在逐像素视差估计时能够融合目标像素点邻域的上下文信息.此外,模型采取不同深度的卷积块从中心视角图中提取场景的结构特征,并将该结构特征引入对应的跳跃连接中,为视差图预测提供了额外的边缘特征参考,进一步提高了计算精确度.对HCI-4D光场基准测试集的实验结果表明,所提方法的坏像素率(BadPix)指标比对比方法降低了31.2％,均方误差(MSE)指标比对比方法降低了54.6％.对于基准测试集中的光场图像,深度估计的平均计算时间为1.2 s,计算速度远超对比方法.

关键词：光场;深度估计;极平面图;编码-解码器结构;上下文信息

所属期刊栏目：48

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金J19K004

在线出版日期：2021-10-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：212-219

英文信息展示

期刊专题