10.3969/j.issn.2096-4706.2019.11.004
基于深度学习的视觉问答系统
随着互联网的发展,人类可以获得的信息量呈指数型增长,我们能够从数据中获得的知识也大大增多,之前被搁置的人工智能再一次焕发活力.随着人工智能的不断发展,近年来,产生了视觉问答(VQA)这一课题,并发展成为人工智能的一大热门问题.视觉问答(VQA)系统需要将图片和问题作为输入,结合图片及问题中的信息,产生一条人类语言作为输出.视觉问答(VQA)的关键解决方案在于如何融合从输入图像和问题中提取的视觉和语言特征.本文围绕视觉问答问题,从概念、模型等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后对视觉问答未来的研究方向进行了展望.
深度学习、人工智能、视觉问答、自然语言处理
3
TP391.41;TP18(计算技术、计算机技术)
2019-07-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
11-13,16