10.11896/j.issn.1002-137X.2019.05.035
基于多重语义交互的递归式场景理解框架
传统基于前馈设计的视觉系统已经非常普遍,但其存在的一大缺陷是某个环节出现的错误无法被及时修正,从而影响系统的最终性能.为此,提出了一种简易的交互式框架,其特点在于场景语义的不确定性能够通过不同的视觉分析过程协同工作实现求解和优化.在该框架中,分别使用了3个经典的场景理解算法作为视觉分析模块,不同模块之间利用彼此输出的表面布局、边界、深度、视点和物体类等上下文语义之间的交互以实现各自性能的渐进式提升.提出的方法不需要人为设置约束条件,可根据需求插入新的模块而无须对原有框架和算法进行大的修改,具有良好的可扩展性.基于Geometric Context数据集的实验结果表明,这种基于本征信息交互的反馈式设计通过多次递归后能够有效弥补前馈式系统存在的不足,其中表面布局、边界和视点估计的平均精度提升了5%以上,而物体类的平均检测精度也提升了6%以上,其可成为未来改进视觉系统性能的途径之一.
表面布局估计、边界/深度估计、物体/视点检测、多重语义交互、递归式场景理解
46
TP391.4(计算技术、计算机技术)
国家自然科学青年基金61502256;浙江省重点研发计划项目2018C01086;宁波市自然科学基金2018A610160
2019-06-05(万方平台首次上网日期,不代表论文的发表时间)
共7页
228-234