10.3778/j.issn.1002-8331.2202-0051
融合知识图谱和多模态的文本分类研究
传统文本分类方法主要是基于单模态数据所驱动的经验主义统计学习方法,缺乏对数据的理解能力,鲁棒性较差,单个模态的模型输入也难以有效分析互联网中越来越丰富的多模态化数据.针对此问题提出两种提高分类能力的方法:引入多模态信息到模型输入,旨在弥补单模态信息的局限性;引入知识图谱实体信息到模型输入,旨在丰富文本的语义信息,提高模型的泛化能力.模型使用BERT提取文本特征,改进的ResNet提取图像特征,TransE提取文本实体特征,通过前期融合方式输入到BERT模型中进行分类,在研究多标签分类问题的MM-IMDB数据集上F1值达到66.5%,在情感分析数据集Twitter15&17上ACC值达到71.1%,结果均优于其他模型.实验结果表明,引入多模态信息和实体信息能够提高模型的文本分类能力.
自然语言处理、知识图谱、多模态、文本分类、B E RT模型
59
TP391(计算技术、计算机技术)
国家自然科学基金;河南省科技攻关项目
2023-02-09(万方平台首次上网日期,不代表论文的发表时间)
共8页
102-109