基于深度学习的文本到图像生成方法综述

引用

摘要：

文本到图像生成方法采用自然语言与图像集特征的映射方式,根据自然语言描述生成相应图像,利用语言属性智能地实现视觉图像的通用性表达.基于卷积神经网络的深度学习技术是当前文本到图像生成的主流方法,为系统地了解该领域的研究现状和发展趋势,按照模型构建及技术实现形式的不同,将已有的技术方法分为直接图像法、分层体系结构法、注意力机制法、周期一致性法、自适应非条件模型法及附加监督法共六类.分别对这些方法进行总结归纳和讨论,论述其构建思路、模型特点、优势及局限性,并对主要的评价指标开展分析对比,最后讨论该技术在模型方法、评价方法和技术改进等方面面临的挑战及未来展望.

关键词：文本到图像生成方法、深度学习、卷积神经网络、评价指标

所属期刊栏目：58

分类号：TP391.1(计算技术、计算机技术)

在线出版日期：2022-05-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共18页

页码：50-67

英文信息展示

期刊专题