10.3778/j.issn.1002-8331.2011-0037
基于LSTM-Attention与CNN混合模型的文本分类方法
针对传统长短时记忆网络(Long Short-Term Memory,LSTM)和卷积神经网络(Convolution Neural Network,CNN)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于LSTM-Attention与CNN混合模型的文本分类方法.使用CNN提取文本局部信息,进而整合出全文语义;用LSTM提取文本上下文特征,在LSTM之后加入注意力机制(Attention)提取输出信息的注意力分值;将LSTM-Attention的输出与CNN的输出进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上.在三个公开数据集上的实验结果表明,提出的模型相较于LSTM、CNN及其改进模型效果更好,可以有效提高文本分类的效果.
文本分类、长短时记忆网络(LSTM)、注意力机制、卷积神经网络(CNN)、特征融合
57
TP391(计算技术、计算机技术)
国家自然科学基金;陕西省自然科学基金
2021-07-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
126-133