10.3969/j.issn.1006-2475.2022.10.014
拥抱融合的多模态灾害分析算法
融合文本和图像的多模态信息相对于单模态可以提升灾害事件分析准确率.但是已有的工作多数将文本特征和图片特征进行简单的融合,在提取、融合特征的时候造成特征的冗余,同时忽略了模态之间的联系,没有考虑到图像和文本之间特征的相关性.为此,本文分析和研究目前流行的多模态融合算法,提出一种拥抱融合的多模态灾害事件分析算法.首先将文本特征和图像的特征向量互相对比,考虑文本和图像特征之间的相关性.然后基于多项抽样,剔除冗余的特征,融合文本特征和图像特征.实验结果表明,拥抱融合在CrisisMMD2.0数据集上实验1的2个任务的分类效果准确率分别高达88.2%、85.1%,都明显优于其他多模态融合模型,表明了该模型的有效性.同时第2个实验也验证了拥抱模型对于不同文本和图像深度学习模型的适用性.
多模态融合、拥抱融合、多项抽样、多模态灾害事件、CrisisMMD2.0
TP391.41(计算技术、计算机技术)
广东省重点领域研发计划项目2019B111101001
2022-10-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
82-87