Voice-2-image:自然语言交互下的智能图像合成
基于自然语言处理以及智能图像处理算法,提出一种由语音自动生成真实感图像的方法.在实现中,由智能抠图得到图像素材,由语音识别、语意解析得到文本结构,以三分图计算、融合算法、图像语境匹配,自动生成真实感图像.相比于以往基于生成式对抗网络(generative adversarial network,GAN)进行文本合成图像、简笔画输入合成图像或用大量人工抠取素材合成图像的方法,本文所提方法更具趣味性、更能节约时间、达到更好的合成效果.该方法可以应用于多种类型的应用设计,如卡通图片合成、儿童学习型应用、照片合成等.
计算机应用、自然语言处理、图像处理、文本结构、真实感图像合成
13
TP399(计算技术、计算机技术)
国家自然科学基金61822204
2021-11-08(万方平台首次上网日期,不代表论文的发表时间)
共12页
399-410