视觉问答与对话综述
视觉问答与对话是人工智能领域的重要研究任务,是计算机视觉与自然语言处理交叉领域的代表性问题之一.视觉问答与对话任务要求机器根据指定的视觉图像内容,对单轮或多轮的自然语言问题进行作答.视觉问答与对话对机器的感知能力、认知能力和推理能力均提出了较高的要求,在跨模态人机交互应用中具有实用前景.文中对近年来视觉问答与对话的研究进展进行了综述,对数据集和算法进行了归纳,对研究挑战和问题进行了总结,最后对视觉问答与对话的未来发展趋势进行了讨论.
视觉问答、视觉对话、视觉语言、视觉推理、深度学习
48
TP391(计算技术、计算机技术)
阿里巴巴-南洋理工大学新加坡联合研究所
2021-03-15(万方平台首次上网日期,不代表论文的发表时间)
共10页
87-96