Voice-2-image:自然语言交互下的智能图像合成

引用

摘要：

基于自然语言处理以及智能图像处理算法,提出一种由语音自动生成真实感图像的方法.在实现中,由智能抠图得到图像素材,由语音识别、语意解析得到文本结构,以三分图计算、融合算法、图像语境匹配,自动生成真实感图像.相比于以往基于生成式对抗网络(generative adversarial network,GAN)进行文本合成图像、简笔画输入合成图像或用大量人工抠取素材合成图像的方法,本文所提方法更具趣味性、更能节约时间、达到更好的合成效果.该方法可以应用于多种类型的应用设计,如卡通图片合成、儿童学习型应用、照片合成等.

关键词：计算机应用、自然语言处理、图像处理、文本结构、真实感图像合成

所属期刊栏目：13

分类号：TP399(计算技术、计算机技术)

资助基金：国家自然科学基金61822204

在线出版日期：2021-11-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：399-410

英文信息展示

期刊专题