10.3778/j.issn.1002-8331.2010-0297
注意力机制海洋场景图像理解算法
针对复杂海洋场景(目标多尺度、对象多样化、风格差异大、时空强关联且存在不确定性目标)特点,研究基于注意力机制的复杂图像有效特征提取方法,提出一种基于卷积神经网络(convolutional neural network,CNN)和长短时记忆网络(long short-term memory,LSTM)相结合的复杂海洋场景图像中文描述生成模型;结合Jieba分词工具,实现了对复杂海洋场景监测图像的自动翻译.利用91卫图助手及无人机高清影像数据,建立模型并对算法进行验证.结果表明,Inception-v4比VGG16模型有更强的复杂特征提取能力,在相同数据集下,Inception-v4模型的图像分类能力高出约5.3个百分点;基于卷积神经网络和长短时记忆模型的图像中文描述生成算法基本可行,可以解决批量图像的自动标注问题,但在算法的稳定性和描述的准确性上需进一步提高.
图像特征提取、注意力机制、长短时记忆模型、图像描述生成、中文分词
58
TP181(自动化基础理论)
自然资源部海洋信息技术创新中心开放基金;国家自然科学基金;国家自然科学基金;广西科技重大专项
2022-05-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
231-239