10.7544/issn1000-1239.2018.20180168
视觉问答技术研究
随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(viSual question answering,VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.
视觉问答、视觉推理、视频问答、深度学习、知识网络
55
TP391(计算技术、计算机技术)
国家自然科学基金优秀青年基金项目61622205
2018-12-21(万方平台首次上网日期,不代表论文的发表时间)
共13页
1946-1958