10.3969/j.issn.1006-2475.2020.07.014
基于Do-Bi-LSTM模型的电子政务文本相似度评估模型
针对当前政务系统中人工审批文本效率低下的问题,本文将文本相似度引入电子政务中.当前基于文本相似度的网络模型中,存在着生成的词向量矩阵巨大,需要大量的时间去训练,而且仅利用上下文的环境来生成词向量,忽略了文档的语序和语义的关系.为了提高效率并降低训练成本,本文提出基于Do-Bi-LSTM文本相似度计算方法,该模型首先通过Doc2vec语言模型把训练数据集中的文本转换成向量,该方法在词向量的基础上增加了文本向量,从而获取了句子之间以及段落之间的相互关系.然后把得到的向量作为Bi-LSTM网络模型的输入进行模型训练,最后与LSTM网络模型、传统的深度网络模型相比,实验表明本文方法的准确率有很大的提高,具有可行性.
文本相似度、Doc2vec、双向长短期记忆网络
TP311(计算技术、计算机技术)
"十二五"山西科技重大专项项目;山西省中科院科技合作项目;山西省科技攻关项目
2020-07-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
71-75