10.11896/j.issn.1002-137X.2018.03.004
基于深度神经网络的图像语句转换方法发展综述
在当前大数据时代,图像由于具有丰富的语义而成为大众获取相关信息的重要来源.基于深度模型的图像语义分析是一种通过深度模型将图像内容转换成可直观理解的语义知识的技术,受到了国内外研究者的广泛关注.该技术根据生成目标语义层次的差异,可分为单类别、多标签和语句3类.首先介绍了以上3类方法对应的深度模型的结构特点,并从技术的演化趋势角度对比分析了3类方法的技术特点和发展现状;然后重点对图像语句转换方法的发展现状、应用场景与性能要求的差异进行了论述,同时对图像语句转换方法的步骤进行分解和论述,从学术界和产业界两方面进行了详细的对比分析,指出了二者的不同研究侧重点与对应的发展现状;最后对具有深度模型的图像语句转换方法进行了总结和展望,指明了该方法当前存在的问题与发展趋势.
深度模型、图像语义分析、卷积神经网络、递归神经网络、支持向量机
45
TP393(计算技术、计算机技术)
教育部人文科学社会基金项目17YJCZH127;北京工商大学两科基金项目LKJJ2017-13
2018-04-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
23-28