10.3969/j.issn.1673-9604.2019.20.167
语义分割的原理及实现
深度学习(DI)开启了人工智能(AI)的新时代.而卷积神经网络(CNN)则是深度学习迅速发展的重要推动力.在图像分类与识别方面,与传统方法相比,深度学习算法可以有效提高图像的分类识别精度.本文通过提出了一种全卷积神经网络,实现图像分类到图像分割的转换.FCN实现了端到端、 像素到像素的训练,突破了语义分割领域之前的最先进的技术.FCN的核心观点是建立'全卷积网络',输入任意尺寸的图片,经过网络的训练学习和推导生成相同尺寸的密集像素的预测.本文实现的FCN改变了当前的分类网络(AlexNet,the VGG net,and GoodLeNet),通过微调网络参数和结构将他们应用到语义分割任务中.我们还在网络中定义了一个跳跃结构,结合来自深层粗层的语义信息和来自浅层细层的表征信息来进一步的产生准确和精细的分割.我们的全卷积网络在PASCAL VOC数据集中分割最出色,在NYUDv2,和SIFT Flow中对于一张图像的推理也只需要花费不到0.2s的时间.
深度学习、卷积神经网络、语义分割、全连接网络
2019-11-19(万方平台首次上网日期,不代表论文的发表时间)
共1页
246